c++截取汉字和英文混合字符串代码实例

来源：互联网收集：自由互联发布时间：2021-05-18

在C++里截取字符串可以使用string.substr()，可是这个函数只能按英文来截取，如果是汉字可能就要计算好字符个数，如果是汉字和英文混合，那就只能望洋兴叹了。可是恰好我需要这样

在C++里截取字符串可以使用string.substr()，可是这个函数只能按英文来截取，

如果是汉字可能就要计算好字符个数，如果是汉字和英文混合，那就只能望洋兴叹了。

可是恰好我需要这样一个函数，于是就自己实现了一个，其中如何判断汉字和英文

参看了此处。

代码简单也无优化，若有更好的方法欢迎提出，代码如下。

#include <iostream>
#include <string>
#include<cstdio>
#include<vector>
#include<typeinfo>
using namespace std;

int is_zh_ch(char p)
{

  /*汉字的两个字节的最高为都为1,这里采用判断最高位的方法
  将p字节进行移位运算，右移8位，这样，如果移位后是0，
  则说明原来的字节最高位为0，不是1那么也就不是汉字的一个字节
  */
  if(~(p >> 8) == 0)
  {
    return 1;//代表不是汉字
  }

  return -1;
}



string sub(string str,int start,int end=-1)
{

  if(typeid(str)==typeid(string) && str.length()>0)
  {
    int len=str.length();

    string tmp="";

    //先把str里的汉字和英文分开
    vector <string> dump;
    int i=0;
    while(i<len)
    {
      if (is_zh_ch(str.at(i))==1)
      {
        dump.push_back(str.substr(i,2));
        i=i+2;

      }
      else
      {
        dump.push_back(str.substr(i,1));
        i=i+1;
      }
    }


    end=end>0?end:dump.size(); //end默认为dump.size
    if(start<0||start>end)
      printf("start is wrong");
　　　　　//直接从dump里取即可
    for(i=start; i<=end; i++)
    {
      tmp+=dump[i-1];
    }

    return tmp;
  }
  else
  {
    printf("str is not string\n");
    return "";

  }
}

int main()
{
  string p="半山wuji";
  cout<<sub(p,1,1)<<endl;
  cout<<sub(p,2,2)<<endl;
  cout<<sub(p,3);
}

以上所述是小编给大家介绍的c++截取汉字英文混合字符串详解整合，希望对大家有所帮助，如果大家有任何疑问请给我留言，小编会及时回复大家的。在此也非常感谢大家对自由互联网站的支持！

上一篇：详解C++基础——类继承
下一篇：mfc文件操作CFile类之创建文件的方法

c++截取汉字和英文混合字符串代码实例

相关文章