ITPub博客

首页 > IT基础架构 > 网络安全 > 自己动手丰衣足食-搞定网页乱码 (转)

自己动手丰衣足食-搞定网页乱码 (转)

原创 网络安全 作者:worldblog 时间:2007-12-13 16:12:27 0 删除 编辑
自己动手丰衣足食-搞定网页乱码 (转)[@more@]

朋友发过来的信件,全都是

Hi, Sorry for writing back late.
数据丢了就丢了吧,以后小心点就ą

59;了,你应该把那些重要的东东刻下

这个样子,怎么办?让他重写,估计谁也没有这个耐心,只好自己捉摸一下了。

判定问题:看这段文本可以猜出每个&#xxxxx;都是一个字符的某种编码,在google上搜了一把,果然发现这些都是unicode码。

分析问题:unicode无非就是2个字节存储一个字符,所以只要将这些unicode码当作16位数存在一个宽字符缓存中,显示就行了。
  还要考虑windows一般显示字符都要转换成mutibyte方式,所以还要用个api函数:WideCharToMultiByte。
 
实现:  code + debug --> ok! 朋友的长信被“解密”了。

现在和大家分享快乐(没有优化,不好意思了):

#define _UNICODE  // IMPORTANT!!

// convert from one wide char to mutibyte char[]
char* Convert( wchar_t wc, char* lpDest )
{
  // construct wchar string
 wchar_t strScr[2];
 strScr[0] = wc;
 strScr[1] = L'';

 // lpDest must a char string with 3 byte, and lpDest[2] == ''
 assert( 0 == lpDest[2] );

 int iRet = WideCharToMultiByte(
 CP_ACP, // codepage
 0, // dwFlags
 strScr, // lpWideCharStr
 -1, // cchWideChar
 lpDest, // lpMutiByteStr
 3, // cchMutiByte
 NULL, // lpDefaultChar
 NULL  // lpUsedDefaultChar
  );

 int iError = GetLastError();
 switch(iError)
 {
 case ERROR_INSUFFICIENT_BUFFER:
 break;
 case ERROR_INVALID_FLAGS:
 break;
 case ERROR_INVALID_PARAMETER:
 break;
 default:
 return lpDest;
 }
 return NULL;
}

// from unicode string to normal string
CString ParseConvert( CString& szSrc )
{
 CString szDest = "";

 int cLength = szSrc.GetLength();
 char cDestChar[] = "??";
 for( int i=0 ; i < cLength; i ++ )
 {
 if( szSrc[i] == '&' && szSrc[i+1] == '#' )  // a unicode char start
 {
 int iCount = 0;
 char szWC[10] ;
 memset( szWC, 0, 10 );
 i += 2;
 while( szSrc[i] != ';' )
 {
 szWC[iCount] = szSrc[i];
 iCount++;
 i++;
 }
 int wc = 0;
 sscanf( szWC, "%d", &wc );
 szDest += Convert( wc, cDestChar );
 }
 else
 {
 szDest += szSrc[i];
 }
 }
 return szDest;
}

void CDecodeDlg::OnButton1()
{
 CFileDialog dlg(TRUE);
 CString szFileName;
 if( dlg.domodal() == IDOK )
 {
 szFileName = dlg.GetPathName();
 }
 else
 return;

 CStdioFile file;
 file.Open( szFileName, CFile::modeRead | CFile::typeText );

 CString szBuf, szLine;

 while( file.ReadString( szLine ) )
 {
 szBuf += szLine;
 szBuf += "n";
 }
 file.Close();

  // try it
 MessageBox( ParseConvert( szBuf ) );

}

Mailto: ma2jun@sina.com


来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/10752043/viewspace-992966/,如需转载,请注明出处,否则将追究法律责任。

请登录后发表评论 登录
全部评论
  • 博文量
    6241
  • 访问量
    2411031