当前位置: 首页 > news >正文

Perfect Hash能用于分词吗?

CMPH - C Minimal Perfect Hashing Library

装起来很方便。apt list有:libcmph0 libcmph-dev libcmph-tools

测试数据是229837个词,从 意义 一一 ... 中航技进出口有限责任公司 2MB

在Intel N100上,cmph -g words 仅耗时0.142秒,让我大吃一惊。生成的words.mph 1.9M

然后用cmph -v -m words.mph query去查询。

请注意,不加-v选项不知道查询结果。query是个文件而不是要查的字符串。

首先cmph -v -m words.mph w2查下字节,每个词都都有个unique ID.

然后造了个query内容如下:

aa
ccc
dd
e
fgh
这也不是个词
这可不是个词

全都有id,都误找到了。


然后用words生成w2,所有的词都是12个汉字,不够的用“无”填充,如:意义无无无无无无无无无无

这次-g跑得更快了:0.109s,查询结果如下:

aa -> 0
ccc -> 127860
dd -> 217306
More than 1 keys were mapped to bin 0
Duplicated or unknown key e in the input
e -> 0
fgh -> 90963
More than 1 keys were mapped to bin 0
Duplicated or unknown key 这也不是个词 in the input
这也不是个词 -> 0
这可不是个词 -> 147619

CMPH

apt search gperf的结果

  • ace-gperf ACE perfect hash function generator
  • gperf Perfect hash function generator
  • triehash Generates perfect hash functions as native machine code

 

Dynamic Perfect Hash Function (dphf) generate a perfect hash function object according to an user provided array.

 

In order to use dphf

  1. include "dphf.hpp"
  2. define a class derived from dphf_hook
  3. populate a vector of your class object (defined in step 2)
  4. construct a dphf object using the vector (created in step 3)
  5. using the object to find the desired item.

作者是Charles Zhang.

(试过了再更新)


 

PTHash is a C++ library implementing fast and compact minimal perfect hash functions as described in the following research papers:

PHOBIC: Perfect Hashing with Optimized Bucket Sizes and Interleaved Coding (ESA 2024).

可能最新,但API看起来不简单,不想试了。


 

AI说:

image

 

http://www.gsyq.cn/news/43837.html

相关文章:

  • 一对一视频直播app开发,golang fmt格式“占位符” - 云豹科技
  • Claude Code:让AI编程助手成为你的开发搭档
  • 2025年立体水幕电影直销厂家权威推荐榜单:3d水幕电影/水幕电影喷泉/水幕电影激光秀源头厂家精选
  • 毕业论文神器:9款免费AI写论文工具全测评,轻松过查重!
  • 十大最佳网络监控工具
  • 2025.11 模拟赛日志
  • 2025年优质的液压矫平机厂家实力及用户口碑排行榜
  • 2025年口碑好的厨房拉篮厂家推荐及采购参考
  • ADB命令详解
  • 2025年质量好的煤炭化验设备品牌厂家排行榜
  • 2025年专业的旋激式湿式除尘器厂家最新用户好评榜
  • 2025年可靠的混凝土水沟滑模机最新TOP品牌厂家排行
  • 2025年知名的无锡液压缸厂家推荐及采购指南
  • 2025年靠谱的阳台壁挂太阳能热水器厂家最新实力排行
  • 2025年口碑好的口袋插入门厂家推荐及选购指南
  • 2025年诚信的千级无尘车间高评价厂家推荐榜
  • 2025年有实力鲍鱼饲料超微粉碎机品牌厂家排行榜
  • 2025年口碑好的高温粘结剂拟薄水铝石厂家推荐及选择参考
  • 2025年靠谱的风管优质厂家推荐榜单
  • 2025年质量好的轻型卡车天窗厂家最新推荐权威榜
  • 2025年质量好的金属封边条厂家最新推荐排行榜
  • 2025年靠谱的自动绕线机高评价厂家推荐榜
  • 2025年靠谱的亚克力加工厂家推荐及选购参考榜
  • 2025年可靠的全屋定制实力厂家TOP推荐榜
  • 2025年口碑好的nfc标签厂家最新热销排行
  • 2025年有实力负氧离子床垫品牌厂家排行榜
  • 使用 NIFI读取EXCEL 数据到数据库
  • 2025年知名的离线压花机TOP品牌厂家排行榜
  • 2025年评价高的改性沥青设备厂家推荐及选择指南
  • 2025年比较好的石塑地板墙板厂家最新推荐权威榜