当前位置: 首页 > news >正文

编程老鸟请注意

我发现getwc(fp)速度很慢。看了下文档:

The getwc() function or macro functions identically to fgetwc(). It may be implemented as a macro, and may evaluate its argument more than once. There is no reason ever to use it.

这倒罢了,字符转换比较麻烦,不能用宏实现可以想像。

过去的书上说getc是宏呢?

getc() is equivalent to fgetc() except that it may be implemented as a macro which evaluates stream more than once.

用下面的程序试了下:

~$ cat t.cpp
#include <stdio.h>
int xxx = getc(stdin);
int*	ppp = NULL;$ gcc -E t.cpp
# 2 "t.cpp"
int xxx = getc(
# 2 "t.cpp" 3 4stdin
# 2 "t.cpp");
int* ppp = 
# 3 "t.cpp" 3 4__null
# 3 "t.cpp";

getc也不是宏。

处理几个G的语料,调用getc几十亿次?!

The fgetws() function is the wide-character equivalent of the fgets(3) function.

我觉得搞NLP的基本上应该把语料都转成UTF-16编码,一次费事,次次受益。

但是GB18030里的生僻字用16位表示不了。

http://www.gsyq.cn/news/46795.html

相关文章:

  • 2025年济南画室培训机构最新推荐:济南画室/济南艺考画室/山东美术艺考培训/山东画室/专业教学,个性化辅导新标杆
  • Flutter零基础极速入门到进阶实战(视频教程) - 教程
  • 题解 P13524 [KOI 2025 #2] 跳跃
  • SOS DP
  • 11月10日
  • 密码校验函数
  • 没有路由器的情况下如何通过电脑网口连接开发板
  • AT_arc160_c [ARC160C] Power Up
  • 英语_阅读_Life in cities_待读
  • 一个强大的排序工具
  • 关于IP、TCP、UDP的校验和计算
  • 元叙事提示注入:突破AI安全边界的攻击技术
  • 【计算机网络表格图表解析】网络体系结构、资料链路层、网络层、传输层、应用层、网络安全、故障排查
  • ONES 重磅升级|全新内核,深度可配置,适配复杂业务流
  • CUDA安装注意事项
  • 102302145 黄加鸿 数据采集与融合技术作业2
  • 2025-11-11 早报新闻
  • K8S(九)—— Kubernetes持久化存储深度解析:从Volume到PV/PVC与StorageClass动态存储 - 教程
  • GPIO 也是一个接口,还有 QEMU GPIODEV 和 GUSE - 指南
  • Air780EPM系列低功耗模组USB设计进阶:硬件要点与LuatOS API开发赋能
  • 如何项目管理软件中计算预算?
  • 实用指南:【Qt】9.信号和槽_信号和槽存在的意义
  • DI依赖注入
  • 解码LVGL定时器
  • 如何选择锡林郭勒西林瓶灌装旋盖机?环境温湿度要求详解
  • 北京GEO优化服务商2025权威推荐:抢占AI搜索流量新入口
  • 雅思报班哪个机构比较好?过来人分享选择经验与价格课程对比
  • 云原生周刊丨runc 三大高危漏洞曝光
  • 【ACM出版 | EI检索稳定】2025年人工智能、业务转型和数据科学创新国际学术会议(ICBTDS 2025)
  • echarts 树形结构图实例