今天研究了一下QFtp这个类,发现访问得到的文件名称中一旦出现中文,不管怎么转换编码格式,最终显示出来的始终都是乱码。于是我深入地对这一现象进行了研究。这里先简单介绍一下我的分析过程:
FTP服务器在收到List指令后,会把当前文件夹的所有项目(包括文件夹和文件的名称,大小,时间,所有者等相关信息)列举出来并返回给FTP客户端。曾经在网上看到有人说过这样一句话:“ftp 在编码问题上相当笨,笨到对编码一无所知”。确实,多数FTP服务器在返回这些名称时采用的文字编码格式为ANSI。这是一个不太好的格式,英文字符占用一个字节存储空间,非英文字符占用两个字节存储空间,长度不一致。而Qt的默认文本编码采用的UTF-16(是么?这里不太肯定,反正从实验得到的数据来看至少是这样的)。即每个字符占据两个字节的存储空间。当QFtp从FTP服务器获取到当前目录下的项目信息时,名称部分直接粗暴地一个个地拆分成了UTF-16格式,并认为这些数据就是UTF-16格式的数据。那么当然不管你如何对其进行转换,数据本身都是错的,又怎么会得到正确的中文显示呢?所以,我们需要对这些数据进行特别的整理。
今天先写到这里,做个记号。过两天会写出详细的解决办法。
项目忙完了,下面贴出解决方法。
由于编码错误,我写了两个函数用于互相转换编码。
一个是由正常编码转为QFTP上所谓的“乱码”的:QString _ToSpecialEncoding(const QString &InputStr);
另一个是由QFTP乱码转换为正常编码的:QString _FromSpecialEncoding(const QString &InputStr);
需要注意的是,使用这个函数之前,你的应用程序应该在界面上能正常显示中文。我是这样来实现的:
首先考虑到代码跨平台,而且主要在Linux平台下运行。因此特别设置了QtCreator的文件默认编码为UTF-8。
也就是说工程中的.cpp和.h文件内部字符编码格式为UTF-8。
然后在工程的main函数中,QApplication app...下一行写如下代码:
QTextCodec::setCodecForCStrings(QTextCodec::codecForName("utf8"));#ifdef Q_OS_WIN
QTextCodec::setCodecForLocale(QTextCodec::codecForName("gbk"));
#else
QTextCodec::setCodecForLocale(QTextCodec::codecForName("utf8"));
#endif
QTextCodec::setCodecForTr(QTextCodec::codecForName("utf8"));
注意,Windows的本地默认编码为gbk(如果你用的是中文系统),Linux本地默认编码为UTF-8。
因此要根据不同的操作系统来进行设置。Linux系统和Mac系统的默认编码都是UTF-8,因此上面的代码没有区分这两个操作系统。
转换函数实现:
QString FTPCommunicator::_FromSpecialEncoding(const QString &InputStr) {#ifdef Q_OS_WIN
return QString::fromLocal8Bit(InputStr.toLatin1());
#else
QTextCodec *codec = QTextCodec::codecForName("gbk");
if (codec) {
return codec->toUnicode(InputStr.toLatin1());
} else {
return QString("");
}
#endif
}
QString FTPCommunicator::_ToSpecialEncoding(const QString &InputStr) {
#ifdef Q_OS_WIN
return QString::fromLatin1(InputStr.toLocal8Bit());
#else
QTextCodec *codec= QTextCodec::codecForName("gbk");
if (codec) {
return QString::fromLatin1(codec->fromUnicode(InputStr));
} else {
return QString("");
}
#endif
}
当使用QFTP的put方法上传的时候,目标文件名参数的位置使用_ToSpecialEncoding(正常编码的字符串);
当使用QFTP的get方法下载的时候,目标文件名参数位置也使用上述函数
当使用QFTP遍历到的文件作为本地文件名时须使用_FromSpecialEncoding(错误编码的字符串);
使用环境:
Windows XP SP3 + IIS 作为FTP服务器。
下载程序运行在Windows XP SP3 和 Ubuntu 10.10。两操作系统均测试通过。若使用其他FTP服务器,设置使用ASCII编码的也可通过。