`
lies_joker
  • 浏览: 39978 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

新版 搜索 日志记录

阅读更多
在本人工作期间,会不断更新优化公司的搜索!

2014年8月4日,搜索BUG修复:
java.lang.UnsupportedOperationException

2014年8月1日,搜索BUG修复:

修复ansj索引分词排序错误导致快速高亮出错的问题

2014年7月29日,搜索BUG修复:

带有html标签的字段高亮bug的修改

分词接口向低版本的solr开发的接口兼容

拼写纠错的加入

2014年7月18日,搜索新特性:

zookeeper和solrcloud的加入,令人兴奋!

solr索引core新的创建方式,不再需要重启solr服务

solr多机器数据的同步和更新

更快的搜索响应速度

搜索性能自动负载,为将来可能扩展搜索机器预留接口

敏感词搜索优化准确度




2014年7月11日,新版搜索新特性:

solr版本升级到solr4.8.1

中文分词器改用ansj,开源,简洁,强大,无害

词库兼顾任意编码格式,不怕乱码

分词器和分词词库分离,降低更新分词器版本难度

分词器配置统一在library.properties中,在solr/WEB-INF/classes目录下

人名智能分词

优良的停用词库

更好用的高亮

schema.xml配置精简

common-lr的加入,小工具多多

预留搜索建议提示接口

2014年12月22日,新版搜索新特性:

中文分词器加入IKanalyzer和ansj_seg并列,针对不同的搜索用不同的分词器,目前875和shengyijie采用IKanalyzer分词器

IKanalyzer二次开发,更加简便的用户词库导入,无需刷新和配置即可使用

IKanalyzer同样的分词器和分词词库分离,IKanalyzer分词器缩小到52KB

升级后的common-lr,优秀易懂的日志输出

solr4.8.1和智能化的IKanalyzer分词器的结合

分享到:
评论

相关推荐

    搜狗五百万用户搜索日志记录

    这是网上找的一个搜狗搜索的日志记录,总共有五百万条用户的搜索信息,可以为练习大数据的数据源,这是网上找的一个搜狗搜索的日志记录,总共有五百万条用户的搜索信息,可以为练习大数据的数据源,这是网上找的一个...

    搜索引擎蜘蛛日志记录查看器

    ASP搜索引擎蜘蛛日志记录查看器 简单实用 ACCESS数据库

    蜘蛛日志在线分析工具源码 快速分析搜索引擎网络爬虫抓取记录

    蜘蛛日志在线分析工具是一款开源的工具,可用于快速分析网站访问日志中搜索引擎网络爬虫的抓取记录。如果你的服务器运行在linux宝塔面板环境下,你只需要登录宝塔面板的linux控制面板,在左侧导航栏中点击”文件”,...

    网站日志蜘蛛在线分析工具源码 日志可视化管理 快速分析搜索引擎网络爬虫抓取记录

    快速分析搜索引擎网络爬虫抓取记录 如果是 linux 宝塔面板 的服务器自然环境,大家登陆宝塔面板linux控制面板后,点一下左边“文件”,在www下的wwwlogs文件目录中就能见到网站访问日志了, ps:经实测,Windows系统...

    搜索引擎蜘蛛访问日志查看器 v1.0.rar

    这个软件可以查看搜索引擎的蜘蛛访问记录,根据这些记录可以看到蜘蛛什么时候来访问过你的站,抓取了什么内容。 使用方法: ----插入asp页面调用 ----插入html页面JS调用 bot.mdb 记录数据库 访问 ...

    搜索引擎蜘蛛访问日志查看器

    这个软件可以查看搜索引擎的蜘蛛访问记录,根据这些记录可以看到蜘蛛什么时候来访问过你的站,抓取了什么内容。 使用方法: ----插入asp页面调用 ----插入html页面JS调用 bot.mdb 记录数据库 访问 zhizhu.asp ...

    网站日志蜘蛛在线分析工具源码 日志可视化管理工具源码 快速分析搜索引擎网络爬虫抓取记录.zip

    如果是 linux 宝塔面板 的服务器自然环境,大家登陆宝塔面板linux控制面板后,点一下左边“文件”,在www下的wwwlogs文件目录中就能见到网站访问日志了, ps:经实测,Windows系统的服务器沒有日志记录功能。...

    网站日志蜘蛛在线分析工具源码 日志可视化管理工具源码 快速分析搜索引擎网络爬虫抓取记录.rar

    如果是 linux 宝塔面板 的服务器自然环境,大家登陆宝塔面板linux控制面板后,点一下左边“文件”,在www下的wwwlogs文件目录中就能见到网站访问日志了, ps:经实测,Windows系统的服务器沒有日志记录功能。...

    日志记录管理系统,可以做日志,可以记笔记,QT源代码

    1.日志搜索: 直接在左下方输入文件名称即可完成搜索。 2.日志阅读: 界面右上方可以选择阅读模式,自主确定是否进行阅读。 3.新建日志文件: 直接点击右下角’笔‘按钮,自动跳转编辑界面,输入内容即可,自动识别...

    log4pb, pb的日志组件, 后台线程记录日志

    日志是异步记录的(每个记录方式开了个线程在后台负责记录处理),大大提高应用程序性能 // 8. 功能可以通过数据库表选择配置(如,多少种记录方式,各线程工作频率) // 9. 日志的数据库记录方式,可以配置缓区大小,...

    java日志记录工具类

    调用方法:IndexDataLog.print(入参),可以设置文件大小,文件写满以后自动创建新的日志文件。一般用来记录用户的搜索词,或操作记录。目前以json格式保存日志,入参稍作修改,可以传入对象,linux和windows都支持。

    2015ASP搜索引擎日志蜘蛛记录统计程序

    摘要:ASP源码,查询搜索,搜索引擎,蜘蛛日志 ASP搜索引擎日志蜘蛛记录统计程序,日志显示...--#include file="iis/Robot.asp"--> 只需要进入页面就可以查看日志记录了。建议在footer.asp之类的文件中添加引用,一步到位。

    日志管理+搜索C#demo

    使用C#读取log文件,并在listbox中按行显示,加入了搜索功能可按关键字搜索并显示在listbox中,可单独导出listbox中的数据。代码比较简单,适合初学者。debug可直接运行。

    hive综合应用案例-用户搜索日志分析.docx

    hive综合应用案例 — 用户搜索日志分析 Hive综合应用案例 — 用户搜索日志分析 在这个综合应用案例中,我们将使用Hive来分析和处理用户搜索日志数据。搜索日志数据通常包含用户搜索的关键词、搜索时间、用户ID等...

    iis日志分析工具_网站日志分析器_蜘蛛访问记录查看器

    iis日志分析工具可分析谷歌,百度,soso,搜索,bing的来访记录,可以到处日期查看。可以查看指定蜘蛛,可以打开文件形式和文件形式。网站日志分析器_蜘蛛访问记录查看器

    搜索引擎蜘蛛爬行访问记录日志查看器.rar

    将访问记录添加至mysql数据库中,方便用户每日统计蜘蛛爬行记录,这样可以对百度等搜索引擎收录有一个大概的了解。 演示请看这里:http://www.a6v.com.cn/zz.php 使用方法:1.创建数据库 ,将 zhizhu.sql 导入...

    雨哲记录搜索蜘蛛日志 build 20100204.rar

    5.增加后台参数配置功能,可后台管理是否启用蜘蛛记录功能,并可在后台配置蜘蛛列表,这样可以设置需要记录的搜索蜘蛛。 6.增加GB2312版本。现在同时发布UTF-8和GB2312两个版本,均包含在同一压缩包中,请选择使用...

Global site tag (gtag.js) - Google Analytics