`
- 浏览:
39978 次
- 性别:
- 来自:
上海
-
最新评论
-
brada:
看这篇文章,不知道为啥作者不能做到起码的公正。举个例子哈: 2 ...
IKanalyzer、ansj_seg、jcseg三种中文分词器的实战较量
-
lies_joker:
monolithic 写道我这边用的是mmseg4j ,与最新 ...
solr4.8的安装,配置,使用,搜索,推荐及看法
-
monolithic:
我这边用的是mmseg4j ,与最新的solr4.9结合,也挺 ...
solr4.8的安装,配置,使用,搜索,推荐及看法
-
lies_joker:
东林碣石 写道我想问一下楼主,你们公司使用solr建的索引的规 ...
solr4.8的安装,配置,使用,搜索,推荐及看法
-
东林碣石:
我想问一下楼主,你们公司使用solr建的索引的规模有多大?有几 ...
solr4.8的安装,配置,使用,搜索,推荐及看法
在本人工作期间,会不断更新优化公司的搜索!
2014年8月4日,搜索BUG修复:
java.lang.UnsupportedOperationException
2014年8月1日,搜索BUG修复:
修复ansj索引分词排序错误导致快速高亮出错的问题
2014年7月29日,搜索BUG修复:
带有html标签的字段高亮bug的修改
分词接口向低版本的solr开发的接口兼容
拼写纠错的加入
2014年7月18日,搜索新特性:
zookeeper和solrcloud的加入,令人兴奋!
solr索引core新的创建方式,不再需要重启solr服务
solr多机器数据的同步和更新
更快的搜索响应速度
搜索性能自动负载,为将来可能扩展搜索机器预留接口
敏感词搜索优化准确度
2014年7月11日,新版搜索新特性:
solr版本升级到solr4.8.1
中文分词器改用ansj,开源,简洁,强大,无害
词库兼顾任意编码格式,不怕乱码
分词器和分词词库分离,降低更新分词器版本难度
分词器配置统一在library.properties中,在solr/WEB-INF/classes目录下
人名智能分词
优良的停用词库
更好用的高亮
schema.xml配置精简
common-lr的加入,小工具多多
预留搜索建议提示接口
2014年12月22日,新版搜索新特性:
中文分词器加入IKanalyzer和ansj_seg并列,针对不同的搜索用不同的分词器,目前875和shengyijie采用IKanalyzer分词器
IKanalyzer二次开发,更加简便的用户词库导入,无需刷新和配置即可使用
IKanalyzer同样的分词器和分词词库分离,IKanalyzer分词器缩小到52KB
升级后的common-lr,优秀易懂的日志输出
solr4.8.1和智能化的IKanalyzer分词器的结合
分享到:
Global site tag (gtag.js) - Google Analytics
相关推荐
这是网上找的一个搜狗搜索的日志记录,总共有五百万条用户的搜索信息,可以为练习大数据的数据源,这是网上找的一个搜狗搜索的日志记录,总共有五百万条用户的搜索信息,可以为练习大数据的数据源,这是网上找的一个...
ASP搜索引擎蜘蛛日志记录查看器 简单实用 ACCESS数据库
蜘蛛日志在线分析工具是一款开源的工具,可用于快速分析网站访问日志中搜索引擎网络爬虫的抓取记录。如果你的服务器运行在linux宝塔面板环境下,你只需要登录宝塔面板的linux控制面板,在左侧导航栏中点击”文件”,...
快速分析搜索引擎网络爬虫抓取记录 如果是 linux 宝塔面板 的服务器自然环境,大家登陆宝塔面板linux控制面板后,点一下左边“文件”,在www下的wwwlogs文件目录中就能见到网站访问日志了, ps:经实测,Windows系统...
这个软件可以查看搜索引擎的蜘蛛访问记录,根据这些记录可以看到蜘蛛什么时候来访问过你的站,抓取了什么内容。 使用方法: ----插入asp页面调用 ----插入html页面JS调用 bot.mdb 记录数据库 访问 ...
这个软件可以查看搜索引擎的蜘蛛访问记录,根据这些记录可以看到蜘蛛什么时候来访问过你的站,抓取了什么内容。 使用方法: ----插入asp页面调用 ----插入html页面JS调用 bot.mdb 记录数据库 访问 zhizhu.asp ...
如果是 linux 宝塔面板 的服务器自然环境,大家登陆宝塔面板linux控制面板后,点一下左边“文件”,在www下的wwwlogs文件目录中就能见到网站访问日志了, ps:经实测,Windows系统的服务器沒有日志记录功能。...
如果是 linux 宝塔面板 的服务器自然环境,大家登陆宝塔面板linux控制面板后,点一下左边“文件”,在www下的wwwlogs文件目录中就能见到网站访问日志了, ps:经实测,Windows系统的服务器沒有日志记录功能。...
1.日志搜索: 直接在左下方输入文件名称即可完成搜索。 2.日志阅读: 界面右上方可以选择阅读模式,自主确定是否进行阅读。 3.新建日志文件: 直接点击右下角’笔‘按钮,自动跳转编辑界面,输入内容即可,自动识别...
日志是异步记录的(每个记录方式开了个线程在后台负责记录处理),大大提高应用程序性能 // 8. 功能可以通过数据库表选择配置(如,多少种记录方式,各线程工作频率) // 9. 日志的数据库记录方式,可以配置缓区大小,...
调用方法:IndexDataLog.print(入参),可以设置文件大小,文件写满以后自动创建新的日志文件。一般用来记录用户的搜索词,或操作记录。目前以json格式保存日志,入参稍作修改,可以传入对象,linux和windows都支持。
摘要:ASP源码,查询搜索,搜索引擎,蜘蛛日志 ASP搜索引擎日志蜘蛛记录统计程序,日志显示...--#include file="iis/Robot.asp"--> 只需要进入页面就可以查看日志记录了。建议在footer.asp之类的文件中添加引用,一步到位。
使用C#读取log文件,并在listbox中按行显示,加入了搜索功能可按关键字搜索并显示在listbox中,可单独导出listbox中的数据。代码比较简单,适合初学者。debug可直接运行。
hive综合应用案例 — 用户搜索日志分析 Hive综合应用案例 — 用户搜索日志分析 在这个综合应用案例中,我们将使用Hive来分析和处理用户搜索日志数据。搜索日志数据通常包含用户搜索的关键词、搜索时间、用户ID等...
iis日志分析工具可分析谷歌,百度,soso,搜索,bing的来访记录,可以到处日期查看。可以查看指定蜘蛛,可以打开文件形式和文件形式。网站日志分析器_蜘蛛访问记录查看器
将访问记录添加至mysql数据库中,方便用户每日统计蜘蛛爬行记录,这样可以对百度等搜索引擎收录有一个大概的了解。 演示请看这里:http://www.a6v.com.cn/zz.php 使用方法:1.创建数据库 ,将 zhizhu.sql 导入...
5.增加后台参数配置功能,可后台管理是否启用蜘蛛记录功能,并可在后台配置蜘蛛列表,这样可以设置需要记录的搜索蜘蛛。 6.增加GB2312版本。现在同时发布UTF-8和GB2312两个版本,均包含在同一压缩包中,请选择使用...