当前位置 : 主页 > 编程语言 > delphi >

delphi – 空缓冲区但IdTCPClient.IOHandler.InputBufferIsEmpty为false

来源:互联网 收集:自由互联 发布时间:2021-06-23
我在下面的代码中遇到问题,idTCPClient用于从telnet服务器读取缓冲区: procedure TForm2.ReadTimerTimer(Sender: TObject);var S: String; begin if IdTCPClient.IOHandler.InputBufferIsEmpty then begin IdTCPClient.IOHandler.Ch
我在下面的代码中遇到问题,idTCPClient用于从telnet服务器读取缓冲区:

procedure TForm2.ReadTimerTimer(Sender: TObject);
var
   S: String; 
begin
   if IdTCPClient.IOHandler.InputBufferIsEmpty then
   begin
     IdTCPClient.IOHandler.CheckForDataOnSource(10);
     if IdTCPClient.IOHandler.InputBufferIsEmpty then Exit;
   end;
   s := idTCPClient.IOHandler.InputBufferAsString(TEncoding.UTF8);
   CheckText(S);
end;

此过程每1000毫秒运行一次,当缓冲区调用CheckText值时.

此代码有效,但有时会将空缓冲区返回给CheckText.

有什么问题?

谢谢

您的代码正在尝试从InputBuffer读取任意数据块,并期望它们是完整且有效的字符串.它是在没有考虑您接收的数据类型的情况下执行此操作.这是多层次的灾难处方.

您已连接到Telnet服务器,但您直接使用TIdTCPClient而不是使用TIdTelnet,因此您必须手动解码在接收任何剩余字符串数据之前接收的任何Telnet序列.查看TIdTelnet的源代码.在触发OnDataAvailable事件之前会发生很多解码逻辑.所有Telnet序列数据都在内部处理,然后OnDataAvailable事件提供解码后留下的任何非Telnet数据.

一旦你完成了Telnet解码,你必须注意的另一个问题是TEncoding.UTF8只处理正确编码的COMPLETE UTF-8序列.如果它遇到编码错误的序列,或者更重要的是遇到不完整的序列,则整个解码失败并返回一个空白字符串.这已被报告为一个错误(见QC #79042).

CheckForDataOnSource()将当时套接字中的任何原始字节存储到InputBuffer中. InputBufferAsString()提取当时InputBuffer中的任何原始字节,并尝试使用指定的编码对它们进行解码.调用InputBufferAsString()时,InputBuffer中的原始字节很可能并不总是包含COMPLETE UTF-8序列.有可能InputBuffer中的最后一个序列仍在等待字节到达套接字,并且在下次调用CheckForDataOnSource()之前不会读取它们.这可以解释为什么你的CheckText()函数在使用TEncoding.UTF8时接收空字符串.

您应该使用IndyUTF8Encoding()(Indy实现自己的UTF-8编码器/解码器以避免TEncoding.UTF8中的解码错误).至少,你不会再得到空白字符串,但是当UTF-8序列跨越多个CheckForDataOnSource()调用时,你仍然会丢失数据(不完整的UTF-8序列将被转换为?字符).仅仅因为这个原因,你不应该在这种情况下使用InputBufferAsString()(即使TEncoding.UTF8确实正常工作).要正确处理这个问题,您应该:

1)手动扫描InputBuffer,计算仅构成COMPLETE UTF-8序列的字节数,然后将该计数传递给InputBuffer.Extract()或TIdIOHandler.ReadString().任何剩余字节都将保留在InputBuffer中以供下次使用.为了实现这一点,您必须摆脱第一个InputBufferIsEmpty()调用,并且无条件地调用CheckForDataOnSource(),这样即使您已经有一些字节,也总是要检查更多字节.

2)改为使用TIdIOHandler.ReadChar()并完全取消对InputBufferIsEmpty()和CheckForDataOnSource()的调用.缺点是如果UTF-8序列解码为UTF-16代理对,您将丢失数据. ReadChar()可以解码代理,但它不能返回对中的第二个字符(我已经开始处理新的ReadChar()重载,以便将来发布的Indy返回String而不是Char,因此可以返回完整的代理对).

网友评论