搜索 (15)
lucene (7)
索引 (2)
查询 (1)
架构 (2)
tika (1)
提取 (1)
中文 (5)
分词 (4)
文档 (1)
模式 (2)
分析 (2)
检索 (1)
系统 (5)
nosql (5)
cassandra (1)
hadoop (1)
membase (1)
mongodb (1)
mysql (1)
互联网 (18)
新闻 (1)
社会化 (1)
2011 (1)
技术 (7)
读书 (16)
2010 (8)
solr (4)
导入 (1)
生活 (19)
品牌 (2)
设计 (6)
2009 (1)
开源 (2)
亚洲 (1)
创业 (4)
ycombinator (1)
创新 (2)
google (6)
英语 (3)
单词 (3)
吴军 (2)
数学 (4)
产品 (6)
博客 (3)
百度 (3)
O2O (1)
电商 (1)
视觉 (1)
语言 (11)
工具 (4)
编程 (4)
linux (1)
工作 (6)
团队 (2)
weibo (25)
北京 (4)
安贞 (3)
学习 (1)
智能 (1)
58 (4)
2012 (1)
理想 (2)
c (1)
lisp (1)
历史 (2)
中医 (1)
词库 (1)
新词 (1)
模型 (1)
ngram (2)
hmm (2)
贝叶斯 (1)
viterbi (1)
好友 (1)
汉字 (1)
拼音 (2)
词典 (1)
移动 (1)
手机 (1)
微软 (1)
输入法 (1)
翻译 (1)
nginx (1)
源码 (1)
编码 (1)
数据库 (1)
语料库 (1)
crf (1)
工程师 (1)
能力 (1)
表达 (1)
沟通 (1)
大学 (1)
简历 (2)
语音 (2)
交互 (1)
机器学习 (2)
资料 (1)
dat (1)
双数组 (1)
感悟 (1)
ubuntu (1)
网络 (1)
pdf (1)
课程 (1)
query (1)
sphinx (1)
上海 (2)
旅行 (1)
知识 (1)
高考 (1)
认知科学 (1)
科学 (3)
哲学 (2)
医学 (1)
养生 (3)
转基因 (1)
食品 (1)
信用 (1)
2013 (2)
总结 (1)
2014 (1)
过去 (1)
未来 (2)
git (1)
github (1)
jekyll (1)
markdown (1)
vim (1)
qq (12)
社交 (1)
腾讯 (2)
ui (1)
ios (1)
个人 (1)
操作系统 (1)
大数据 (5)
人工智能 (4)
- 搜索
- Solr学习4 数据导入
- Solr学习3 管理界面
- Solr学习2 文本分析
- Solr学习1 模式设计
- 近来买书汇总 NOSQL相关
- 好书新发现 《Tika in Action》 《Lucene in Depth》
- 搜索引擎新闻 国内市场价值
- 信息检索学习1 逆向索引基本结构
- Lucene学习7 Lucene分析过程
- Lucene学习6 Lucene文档模式
- Lucene学习5 中文分词
- Lucene学习4 Tika内容提取
- Lucene学习3 搜索引擎体系结构
- Lucene学习2 搜索文本文件
- Lucene学习1 索引文本文件
- lucene
- Lucene学习7 Lucene分析过程
- Lucene学习6 Lucene文档模式
- Lucene学习5 中文分词
- Lucene学习4 Tika内容提取
- Lucene学习3 搜索引擎体系结构
- Lucene学习2 搜索文本文件
- Lucene学习1 索引文本文件
- 索引
- 信息检索学习1 逆向索引基本结构
- Lucene学习1 索引文本文件
- 查询
- Lucene学习2 搜索文本文件
- 架构
- 互联网系统架构的未来 Google App Engine
- Lucene学习3 搜索引擎体系结构
- tika
- Lucene学习4 Tika内容提取
- 提取
- Lucene学习4 Tika内容提取
- 中文
- crf 中文分词
- 中文语料库
- 中文编码
- 新词发现,词库整理
- Lucene学习5 中文分词
- 分词
- crf 中文分词
- n-gram语言模型,hmm模型,统一框架
- 新词发现,词库整理
- Lucene学习5 中文分词
- 文档
- Lucene学习6 Lucene文档模式
- 模式
- Solr学习1 模式设计
- Lucene学习6 Lucene文档模式
- 分析
- Solr学习2 文本分析
- Lucene学习7 Lucene分析过程
- 检索
- 信息检索学习1 逆向索引基本结构
- 系统
- nginx源码分析1 start
- 互联网系统架构的未来 Google App Engine
- MongoDB好消息 视觉中国从MySQL转到MongoDB
- Hadoop欣慰 Hadoop和Membase整合
- Cassandra追忆 Twitter停用Cassandra的误解
- nosql
- 近来买书汇总 NOSQL相关
- 好书新发现 《Tika in Action》 《Lucene in Depth》
- MongoDB好消息 视觉中国从MySQL转到MongoDB
- Hadoop欣慰 Hadoop和Membase整合
- Cassandra追忆 Twitter停用Cassandra的误解
- cassandra
- Cassandra追忆 Twitter停用Cassandra的误解
- hadoop
- Hadoop欣慰 Hadoop和Membase整合
- membase
- Hadoop欣慰 Hadoop和Membase整合
- mongodb
- MongoDB好消息 视觉中国从MySQL转到MongoDB
- mysql
- MongoDB好消息 视觉中国从MySQL转到MongoDB
- 互联网
- 无题,感悟
- 2010年中科软离职后投身互联网的简历
- 移动互联网 手机神器
- 电子商务的未来 全新的概念O2O
- 用心经营博客,结实天下英雄 纪念空间一星期访问量突破1000
- 再次思考吴军的《浪潮之巅》互联网公司警钟长鸣
- 互联网产品设计 国内互联网的潜在机会
- 互联网全业务混战时代,我们该如何开发互联网产品?
- 搜索的未来-信息检索算法 想起吴军老师的《数学之美》
- 纪念Google十二岁 重翻《Google十周年》
- 有关互联网的思考6 YCombinator展示36家孵化创业公司
- 有关互联网的思考5 十大tech-enable商业发展趋势
- 有关互联网的思考2 2010年最具影响力十大技术
- 有关互联网的思考3 全球最值钱互联网创业公司百强
- 有关互联网的思考4 Accelerate 2010评出亚洲50大新兴应用
- 有关互联网的思考1 2009年最受关注的11个开源公司
- 有关互联网的思考0(补遗) 社会化时代 2011十大战略技术
- 搜索引擎新闻 国内市场价值
- 新闻
- 搜索引擎新闻 国内市场价值
- 社会化
- 有关互联网的思考0(补遗) 社会化时代 2011十大战略技术
- 2011
- 有关互联网的思考0(补遗) 社会化时代 2011十大战略技术
- 技术
- 读书感悟9 历史上的科学与技术
- 无题,感悟
- 我们的2012
- 新年的坚定,geek归来!
- 有关互联网的思考5 十大tech-enable商业发展趋势
- 有关互联网的思考2 2010年最具影响力十大技术
- 有关互联网的思考0(补遗) 社会化时代 2011十大战略技术
- 读书
- 我的图书馆3 难以舍弃而暂时放下
- 我的图书馆1 最近读的书
- 我的图书馆2 急需补习
- 读书感悟10 2014 行走在过去与未来之间
- 读书感悟9 历史上的科学与技术
- 读书感悟8 转基因 食品安全与社会信用
- 读书感悟7 那些难以忘却的国术 中医和武术
- 读书感悟6 医学与养生
- 读书感悟5 哲学是思想的牢笼 科学与实践 数学与编程
- 读书感悟4 认知科学 数学科学与哲学的思考
- 读书感悟3 生活与理想
- 读书感悟2 数学与高考
- 读书感悟1 习惯与知识
- 好友分享 读书境界
- 近来买书汇总 NOSQL相关
- 好书新发现 《Tika in Action》 《Lucene in Depth》
- 2010
- 电子商务的未来 全新的概念O2O
- 有关互联网的思考6 YCombinator展示36家孵化创业公司
- 有关互联网的思考5 十大tech-enable商业发展趋势
- 有关互联网的思考2 2010年最具影响力十大技术
- 有关互联网的思考3 全球最值钱互联网创业公司百强
- 有关互联网的思考4 Accelerate 2010评出亚洲50大新兴应用
- 近来买书汇总 NOSQL相关
- 好书新发现 《Tika in Action》 《Lucene in Depth》
- solr
- Solr学习4 数据导入
- Solr学习3 管理界面
- Solr学习2 文本分析
- Solr学习1 模式设计
- 导入
- Solr学习4 数据导入
- 生活
- 我在过着最奢侈的生活3 最不可能的路
- 我在过着最奢侈的生活2 最震惊的收获
- 我在过着最奢侈的生活1 离职后的8个月
- 2013 已经过去的世界
- 读书感悟3 生活与理想
- 2013-07 上海 新生活的开始
- 无题,感悟
- 2010年中科软离职后投身互联网的简历
- 2010年海南大学刚毕业时奔赴北京的简历
- 历史文化 中医
- 我们的2012
- baidu空间 back again
- 2011-12 安贞 北京的心情
- 2011-09 安贞 北京生活点滴2
- 2011-08 安贞 北京生活点滴1
- 视觉与语言
- 新年的坚定,geek归来!
- iPad 有关品牌问题(下)
- 美特斯邦威 有关品牌问题(上)
- 品牌
- iPad 有关品牌问题(下)
- 美特斯邦威 有关品牌问题(上)
- 设计
- 设计理念 我们需要什么样的ui
- 设计理念 腾讯还是有不少好的设计师的
- 用心经营博客,结实天下英雄 纪念空间一星期访问量突破1000
- 互联网产品设计 国内互联网的潜在机会
- 互联网全业务混战时代,我们该如何开发互联网产品?
- 美特斯邦威 有关品牌问题(上)
- 2009
- 有关互联网的思考1 2009年最受关注的11个开源公司
- 开源
- nginx源码分析1 start
- 有关互联网的思考1 2009年最受关注的11个开源公司
- 亚洲
- 有关互联网的思考4 Accelerate 2010评出亚洲50大新兴应用
- 创业
- 新年的坚定,geek归来!
- 有关互联网的思考6 YCombinator展示36家孵化创业公司
- 有关互联网的思考3 全球最值钱互联网创业公司百强
- 有关互联网的思考4 Accelerate 2010评出亚洲50大新兴应用
- ycombinator
- 有关互联网的思考6 YCombinator展示36家孵化创业公司
- 创新
- 再次思考吴军的《浪潮之巅》互联网公司警钟长鸣
- iPad 有关品牌问题(下)
- 终于
- 四年后再看google 下一个五年
- how to be one googler?
- 再次思考吴军的《浪潮之巅》互联网公司警钟长鸣
- 纪念Google十二岁 重翻《Google十周年》
- 互联网系统架构的未来 Google App Engine
- 英语
- nlp-words
- 英语学习 专业英语系列2
- 英语学习 专业英语系列1
- 单词
- nlp-words
- 英语学习 专业英语系列2
- 英语学习 专业英语系列1
- 吴军
- 再次思考吴军的《浪潮之巅》互联网公司警钟长鸣
- 搜索的未来-信息检索算法 想起吴军老师的《数学之美》
- 数学
- 读书感悟5 哲学是思想的牢笼 科学与实践 数学与编程
- 读书感悟4 认知科学 数学科学与哲学的思考
- 读书感悟2 数学与高考
- 搜索的未来-信息检索算法 想起吴军老师的《数学之美》
- 产品
- 设计理念 我们需要什么样的ui
- 设计理念 腾讯还是有不少好的设计师的
- 我们的2012
- 用心经营博客,结实天下英雄 纪念空间一星期访问量突破1000
- 互联网产品设计 国内互联网的潜在机会
- 互联网全业务混战时代,我们该如何开发互联网产品?
- 博客
- baidu空间 back again
- 用心经营博客,结实天下英雄 纪念空间一星期访问量突破1000
- 互联网产品设计 国内互联网的潜在机会
- 百度
- 我们的2012
- baidu空间 back again
- 用心经营博客,结实天下英雄 纪念空间一星期访问量突破1000
- O2O
- 电子商务的未来 全新的概念O2O
- 电商
- 电子商务的未来 全新的概念O2O
- 视觉
- 视觉与语言
- 语言
- query-nlp 牛人
- nlp-words
- 语音交互的机会
- crf 中文分词
- 中文语料库
- 创新者的窘境 微软拼音
- GB2312,汉字拼音对照原始数据
- 贝叶斯方法
- n-gram语言模型,hmm模型,统一框架
- 新词发现,词库整理
- 视觉与语言
- 工具
- 老外那些强大的工具
- ubuntu网络配置
- linux命令
- 编程工具 UltraEdit EditPlus
- 编程
- 21世纪人人都需要编程
- 读书感悟5 哲学是思想的牢笼 科学与实践 数学与编程
- 完美的c和lisp
- 编程工具 UltraEdit EditPlus
- linux
- linux命令
- 工作
- 2013-04 58 北京关注的那些事3
- 如何表达和沟通
- 2013-01 58 北京关注的那些事2
- 2012-06 58 北京关注的那些事1
- 2012-04 58 北京生活点滴3
- how to be one googler?
- 团队
- 如何表达和沟通
- how to be one googler?
- 2014working weibo点滴记录8 last media
- 2014working weibo点滴记录7 old times
- 2014working weibo点滴记录6 agent future
- 2014working weibo点滴记录5 some tools
- 2014working weibo点滴记录4 deep semantics
- 2014working weibo点滴记录3 system tools
- 2014working weibo点滴记录2 dialogue system must
- 2014working weibo点滴记录1 dialogue system start
- 2014reading weibo信息轨迹12 spoken dialogue
- 2014reading weibo信息轨迹11 deep language
- 2014reading weibo信息轨迹10 this year
- 2014reading weibo信息轨迹9 deep mind
- 2014reading weibo信息轨迹8 machine learning
- 2014reading weibo信息轨迹7 deep learning
- 2014reading weibo信息轨迹6 neural science
- 2014reading weibo信息轨迹5 language
- 2014reading weibo信息轨迹4 hardware
- 2014reading weibo信息轨迹3 paper mining
- 2014reading weibo信息轨迹2 papers
- 2014reading weibo信息轨迹1 github
- 2013weibo信息轨迹3 math science
- 2013weibo信息轨迹2 new world
- 2013weibo信息轨迹1 shanghai
- weibo信息轨迹2 internet
- weibo信息轨迹1 start
- 北京
- 2013-06 从北京到上海
- 2011-12 安贞 北京的心情
- 2011-09 安贞 北京生活点滴2
- 2011-08 安贞 北京生活点滴1
- 安贞
- 2011-12 安贞 北京的心情
- 2011-09 安贞 北京生活点滴2
- 2011-08 安贞 北京生活点滴1
- 学习
- how about intelligence
- 智能
- how about intelligence
- 58
- 2013-04 58 北京关注的那些事3
- 2013-01 58 北京关注的那些事2
- 2012-06 58 北京关注的那些事1
- 2012-04 58 北京生活点滴3
- 2012
- 我们的2012
- 理想
- 读书感悟3 生活与理想
- 我们的2012
- c
- 完美的c和lisp
- lisp
- 完美的c和lisp
- 历史
- 读书感悟9 历史上的科学与技术
- 历史文化 中医
- 中医
- 历史文化 中医
- 词库
- 新词发现,词库整理
- 新词
- 新词发现,词库整理
- 模型
- n-gram语言模型,hmm模型,统一框架
- ngram
- 贝叶斯方法
- n-gram语言模型,hmm模型,统一框架
- hmm
- 贝叶斯方法
- n-gram语言模型,hmm模型,统一框架
- 贝叶斯
- 贝叶斯方法
- viterbi
- 贝叶斯方法
- 好友
- 好友分享 读书境界
- 汉字
- GB2312,汉字拼音对照原始数据
- 拼音
- 创新者的窘境 微软拼音
- GB2312,汉字拼音对照原始数据
- 词典
- GB2312,汉字拼音对照原始数据
- 移动
- 移动互联网 手机神器
- 手机
- 移动互联网 手机神器
- 微软
- 创新者的窘境 微软拼音
- 输入法
- 创新者的窘境 微软拼音
- 翻译
- 创新者的窘境 微软拼音
- nginx
- nginx源码分析1 start
- 源码
- nginx源码分析1 start
- 编码
- 中文编码
- 数据库
- 数据库 为什么如此重要
- 语料库
- 中文语料库
- crf
- crf 中文分词
- 工程师
- 决定一个工程师能力的主要因素
- 能力
- 决定一个工程师能力的主要因素
- 表达
- 如何表达和沟通
- 沟通
- 如何表达和沟通
- 大学
- 2010年海南大学刚毕业时奔赴北京的简历
- 简历
- 2010年中科软离职后投身互联网的简历
- 2010年海南大学刚毕业时奔赴北京的简历
- 语音
- sphinx语音 tutorial资料
- 语音交互的机会
- 交互
- 语音交互的机会
- 机器学习
- 机器学习 开放课程与资源
- 机器学习资料
- 资料
- 机器学习资料
- dat
- darts 优化dat实现
- 双数组
- darts 优化dat实现
- 感悟
- 无题,感悟
- ubuntu
- ubuntu网络配置
- 网络
- ubuntu网络配置
- 老外那些强大的工具
- 课程
- 机器学习 开放课程与资源
- query
- query-nlp 牛人
- sphinx
- sphinx语音 tutorial资料
- 上海
- 2013-07 上海 新生活的开始
- 2013-06 从北京到上海
- 旅行
- 2013-07 西行记 青海 西藏 陕西 新疆
- 知识
- 读书感悟1 习惯与知识
- 高考
- 读书感悟2 数学与高考
- 认知科学
- 读书感悟4 认知科学 数学科学与哲学的思考
- 科学
- 读书感悟9 历史上的科学与技术
- 读书感悟5 哲学是思想的牢笼 科学与实践 数学与编程
- 读书感悟4 认知科学 数学科学与哲学的思考
- 哲学
- 读书感悟5 哲学是思想的牢笼 科学与实践 数学与编程
- 读书感悟4 认知科学 数学科学与哲学的思考
- 医学
- 读书感悟6 医学与养生
- 养生
- 读书感悟8 转基因 食品安全与社会信用
- 读书感悟7 那些难以忘却的国术 中医和武术
- 读书感悟6 医学与养生
- 转基因
- 读书感悟8 转基因 食品安全与社会信用
- 食品
- 读书感悟8 转基因 食品安全与社会信用
- 信用
- 读书感悟8 转基因 食品安全与社会信用
- 2013
- 读书感悟10 2014 行走在过去与未来之间
- 2013 已经过去的世界
- 总结
- 2013 已经过去的世界
- 2014
- 读书感悟10 2014 行走在过去与未来之间
- 过去
- 读书感悟10 2014 行走在过去与未来之间
- 未来
- 终于
- 读书感悟10 2014 行走在过去与未来之间
- git
- hello, github and jekyll
- github
- hello, github and jekyll
- jekyll
- hello, github and jekyll
- markdown
- hello, github and jekyll
- vim
- hello, github and jekyll
- 2015QQ记录点滴2 new world 2
- 2015QQ记录点滴1 new world
- QQ记录点滴10 ai
- QQ记录点滴9 insights
- QQ记录点滴8 math
- QQ记录点滴7 science
- QQ记录点滴6 philosophy
- QQ记录点滴5 dialogue
- QQ记录点滴4 internet
- QQ记录点滴3 this year
- QQ记录点滴2 city
- QQ记录点滴1 github
- 社交
- 个人时代 社交平台上的自媒体机遇
- 腾讯
- 设计理念 我们需要什么样的ui
- 设计理念 腾讯还是有不少好的设计师的
- ui
- 设计理念 我们需要什么样的ui
- ios
- 设计理念 我们需要什么样的ui
- 个人
- 个人时代你应该做什么
- 操作系统
- 可穿戴设备和物联网 新时代的操作系统是如此不同
- 大数据
- 大数据的陷阱5 新一代的工具链
- 大数据的陷阱4 真正需要什么
- 大数据的陷阱3 高性能
- 大数据的陷阱2 未来的服务器
- 大数据的陷阱1 用户需求
- 人工智能
- AI之路4 第四次科技革命的开端
- AI之路3 google之后的未来
- AI之路2 关键性产品
- AI之路1 最近的突破