laravelphp安装使用结巴分词进行中文分词

laravelphp安装使用结巴分词进行中文分词,第1张

概述安装php版本结巴分词git clone https://github.com/jonnywang/phpjieba.gitcd phpjieba/cjieba 安装PHP版本结巴分词
git clone https://github.com/jonnywang/PHPjIEba.gitcd PHPjIEba/cjIEbamakecd ..PHPize./configuremakemake install

如果你要安装其他版本的结巴分词,比如java,c++,python版本参考:https://github.com/yanyiwu/cppjieba

在PHP.ini配置结巴分词

需要在PHP.ini中配置结巴分词,ubuntu中位于/usr/local/etc/PHP/7.0/PHP.ini,你可以自己查找自己的文件位置,同时你要找到自己下载的PHPjIEba.git的位置:

extension=jIEba.sojIEba.enable=1jIEba.dict_path=/private/var/www/PHPjIEba/cjIEba/dict*jIEba.dict_path指向字典所在对应目录,请根据自己编译目录替换更改
测试
$result = jIEba('小明硕士毕业于中国科学院计算所,后在日本京都大学深造');echo implode('/', $result) . PHP_Eol;//计算所/小明/京都大学/深造/硕士/中国科学院/毕业/日本$result = jIEba('小明硕士毕业于中国科学院计算所,后在日本京都大学深造', 1, 50);echo implode('/', $result) . PHP_Eol;//小明/硕士/毕业/于/中国/科学/学院/科学院/中国科学院/计算/计算所/,/后/在/日本/京都/大学/京都大学/深造$result = jIEba('他心理健康', 1);echo implode('/', $result) . PHP_Eol;//他/心理/健康/心理健康$result = jIEba('this is a demo, my name is jony', 1, 10);echo implode('/', $result) . PHP_Eol;//demo/jony$result = jIEba('this is a demo, my name is jony');echo implode('/', $result) . PHP_Eol;//this/ /is/ /a/ /demo/,/ /my/ /name/ /is/ /jony$result = jIEba('小明硕士毕业于中国科学院计算所,后在日本京都大学深造', 2);print_r($result);Array(    [小明] => x    [硕士] => n    [毕业] => n    [于] => p    [中国科学院] => nt    [计算所] => n    [,] => x    [后] => f    [在] => p    [日本] => ns    [京都大学] => nz    [深造] => v)

更新请参考example目录

词性可参考HanLP词性标注集解释

项目地址:jonnywang/phpjieba

修改字典

上面我们配置了/private/var/www/PHPjIEba/cjIEba/dict为存放目录,接下来我们要定义自己的字典库,一般情况下在user.dict.utf8中修改即可,可以把值设置高点防止其它权值太高导致你设置的无效:

不处理 999999999 nz
总结

以上是内存溢出为你收集整理的laravel/php安装使用结巴分词进行中文分词全部内容,希望文章能够帮你解决laravel/php安装使用结巴分词进行中文分词所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://www.outofmemory.cn/langs/1268704.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-06-08
下一篇 2022-06-08

发表评论

登录后才能评论

评论列表(0条)

保存