textbox

IT博客 联系 聚合 管理
  103 Posts :: 7 Stories :: 22 Comments :: 0 Trackbacks
程序原理通过通过判断文件头几个字节来判断文件的编码格式

ANSI :         无格式定义;
Unicode :      前两个字节为 FFFE ;
Unicode big endian : 前两字节为 FEFF ; 
UTF-8 :        前两字节为 EFBB ;

代码部分来自网络+自己修改
定义:

type
  TTextFormat 
= (tfAnsi, tfUnicode, tfUnicodeBigEndian, tfUtf8);
end;
const
  TextFormatFlag
: array [tfAnsi .. tfUtf8] of word = ($0000, $FFFE, $FEFF,
    
$EFBB);

函数
function GetFileType(const FileName: string): TTextFormat;
var
  w
: word;
  b
: Byte;
begin
  with TFileStream
.Create(FileName, fmOpenRead or fmShareDenyNone) do
    
try
      Read(w
, 2);
      asm    // 因为是以Word数据类型读取,故高低字节互换
          PUSH EAX
          MOVZX EAX,  w
          XCHG AL,AH
          MOV w, AX
          POP EAX
        end;
      
       if w = TextFormatFlag[tfUnicode] then
        Result 
:= TTextFormat.tfUnicode
      
else if w = TextFormatFlag[tfUnicodeBigEndian] then
        Result 
:= TTextFormat.tfUnicodeBigEndian
      
else if w = TextFormatFlag[tfUtf8] then
        Result 
:= TTextFormat.tfUtf8
      
else
        Result 
:= TTextFormat.tfAnsi;
    finally
      Free;
    
end;
end;


posted on 2011-03-02 11:53 零度 阅读(1786) 评论(0)  编辑 收藏 引用 所属分类: delphi
只有注册用户登录后才能发表评论。