scws(Simple Chinese Word Segmentation)中文分词开源系统
这个东西很好用的。有支持windows版的也有linux版本的,相对之下windows的比较容易配置,因为有已经编译好的dll文件,但是linux版本的相对比较不好编译。具体的配置这里不做陈述,在服务器栏目下有陈述,这里贴出一个简单的测试程序。但是此程序是通用的。呵呵<?php$so=scws... « 阅读全文
SCWS-PHP扩展的说明及用法(图)
详细请访问:[SCWS简介]SCWS是SimpleChineseWordsSegmentation的缩写(简易中文分词系统)。它是一套基于词频词典的机械中文分词引擎,它能将一整段的汉字基本正确的切分成词,因为词是汉语的基本语素单位,而书写的时候不像英语会在词之间用空格分开,所以如何准确快速的分词一直... « 阅读全文
php分词搜索插件
php中中文分词和模糊搜索-[PHP]在java中做全文搜索的话可以使用Lucene以及中文分词插件。在php中做全文搜素引擎可以使用Sphinx,中文分词也有很多选择,使用scws是不错的选择。scws的全称是SimpleChineseWordsSegmentation。使用scws有三种方式:一... « 阅读全文
Php自动分词获取内容关键词
现在的主流CMS基本都自带了采集功能,内容和标题相对来说很好处理,但大部分情况关键词很难提取到。于是自动获取关键字成为当前PHP类CMS的“传统问题”。那如何才能自动获取关键词呢,其主要步骤主要可以分为如下三个步骤:1,通过分词算法将标题和内容分别进行分割,提取出关键词和频度在内容的分词阶段,当前主... « 阅读全文
Permanent Link to SCWS中文分词
因为在上一篇文章的末尾提到的,coreseek分词存在的问题,经过详细的测试,比较了原版sphinx和coreseek用同一种配置文件,都不分词索引的情况下,coreseek的速度仍然大幅度落后于原版sphinx,于是决定近期摒弃coreseek,换上原版的sphinx。但这样的话,coreseek... « 阅读全文
freebsd环境下安装apache,php,mysql_Iris
注:所有的安装文件均存在/usr/local/backup目录下.一、安装MYSQL安装mysql5.1.18二进制版# tar -zxvf mysql-5.1.18-beta-freebsd6.0-i386.tar.gz #解压缩安装包# mv mysql-5.1.18-beta-freebsd6.0-i386 /usr/local/mysql #拷贝到/usr/local目录下并改名为mysql# cd /usr/local/mysql ... « 阅读全文
SCWS 简易分词函数
简介SCWS是一个简易的分词引擎,它可以将输入的文本字符串根据设定好的选项切割后以数组形式返回每一个词汇。它为中文而编写,支持gbk和utf-8字符集,适当的修改词典后也可以支持非中文的多字节语言切词(如日文、韩文等)。除分词外,还提供一个简单的关键词汇统计功能,它内置了一个简单的算法来排序。本扩展... « 阅读全文
中文分词 SCWS 的安装
SCWS是SimpleChineseWordsSegmentation的缩写,即简易中文分词系统。 这是一套基于词频词典的机械中文分词引擎,它能将一整段的汉字基本正确的切分成词。词是汉语的基本语素单位,而书写的时候不像英语会在词之间用空格分开,所以如何准确而又快速的分词一直是中文分词的攻关难点。 ... « 阅读全文
基于Php实现自动获取关键词的分析
现在的CMS都自带了采集功能,内容和标题相对来说很好处理,但大部分情况关键词很难能提取到。于是自动获取关键字成为当前PHP类CMS的“传统问题”。那如何才能自动获取关键词呢,其主要步骤主要可以分为如下三个步骤: 1,通过分词算法将标题和内容分别进行分割,提取出关键词和频度在内容的分词阶段,当前主要的... « 阅读全文
php中文分词scws 安装
1. 取得 scws-1.1.1 的代码wget http://www.ftphp.com/scws/down/scws-1.1.2.tar.bz22. 解开压缩包[hightman@d1 ~]$ tar xvjf scws-1.1.1.tar.bz23. 进入目录执行配置脚本和编译[hightman@d1 ~]$ cd scws-1.1.1[hightman@d1 ~/scws-1.1.1]$ ./configure --prefix=/usr/local/scws ; make ... « 阅读全文
- 1

