아파치 壘씬
(Apache Lucene)은
자바
言語로 이루어진
情報 檢索
라이브러리
自由-오픈 소스 소프트웨어
이며
더그 커팅
에 依해 開發되었다.
아파치 소프트웨어 財團
에 依해 支援되며
아파치 라이선스
下에 配布된다.
追加的인 開發을 통해 旣存의 자바 言語 以外에
오브젝트 파스칼
,
펄
,
C 샤프
,
C++
,
파이썬
,
루비
,
PHP
等 다른
프로그래밍 言語
를 使用할 수 있도록 變更되었다.
[2]
歷史
[
編輯
]
더그 커팅
은 아파치 壘씬을 1999年에 開發하였다.
[3]
처음에는
SourceForge
웹 사이트에서 다운로드 할 수 있었다. 2001年 9月에 아파치 소프트웨어 財團의
자카르타 프로젝트
에 合流하여 2005年 2月에 自體 最上位 아파치 프로젝트가 되었다. 壘씬이라는 이름은 더그 커팅의 아내의 中間 이름과 그의 할머니의 이름이다.
[4]
아파치 壘씬은 以前에 Lucene.NET,
아파치 머下웃
,
티카
및
너치
와 같은 여러 下位 프로젝트를 包含시켰다. 이 프로젝트들은 現在 最上位 프로젝트로 獨立한 狀態이다.
2010年 3月
아파치 솔라
檢索 서버는 壘씬의 下位 프로젝트로 合流하고 開發者 커뮤니티가 統合되었다.
主要 機能
[
編輯
]
專門 檢索
(Full text)
索引
및 檢索 機能을 必要로 하는 모든 應用 프로그램에 적합하지만 壘씬은
웹 檢索 엔진
및 로컬 單一 사이트 檢索 具現에서의 有用性으로 널리 알려져 있다.
[5]
[6]
壘씬은
編輯 거리
를 基盤으로 퍼지 檢索을 遂行하는 機能을 包含한다.
[7]
壘씬은 또한 推薦 시스템을 具現하는데 使用되고 있다.
[8]
例를 들어, 壘씬의 'MoreLikeThis'
클래스
는 類似한 文書에 對한 推薦을 生成할 수 있다.
壘씬 論理 아키텍처의 核心은 텍스트를 가지고 있는 필드를 包含하는 文書의 槪念이다. 이러한 柔軟性이 壘씬의
API
가
파일 形式
과 獨立的으로 만들어주었다.
PDF
,
HTML
,
마이크로소프트 워드
,
마인드맵
및
오픈도큐먼트
뿐만 아니라 많은 다른 情報(이미지 除外)의 텍스트 情報는 抽出 할 수 있는 限 모두 索引을 生成할 수 있다.
[9]
壘씬 基盤 프로젝트들
[
編輯
]
壘씬 그 自體는 索引 및 檢索을 提供하는 라이브러리이며,
웹 크롤러
나 HTML
構文 分析
等의 機能은 包含하지 않는다. 하지만 다양한 프로젝트가 壘씬의 機能을 擴張한다.
壘씬 使用者들
[
編輯
]
擴張機能이 包含되지 않은 壘씬 使用者들은 壘씬의 "Powered By"
[18]
페이지 參照. 例를 들어
트위터
는 實時間 檢索을 위해서 壘씬을 使用하고 있다.
같이 보기
[
編輯
]
各州
[
編輯
]
- ↑
“Welcome to Apache Lucene”
. Lucene™ News section. 2020年 2月 12日에
原本 文書
에서 保存된 文書
. 2020年 2月 12日에 確認함
.
- ↑
“LuceneImplementations”
. apache.org
. 2015年 9月 23日에 確認함
.
- ↑
KeywordAnalyzer
“Better Search with Apache Lucene and Solr”
(PDF)
. 19 November 2007. 31 January 2012에
原本 文書
(PDF)
에서 保存된 文書.
- ↑
Barker, Deane (2016). 《Web Content Management》. O'Reilly. 233쪽.
ISBN
1491908106
.
- ↑
McCandless, Michael; Hatcher, Erik; Gospodneti?, Otis (2010). 《Lucene in Action, Second Edition》. Manning. 8쪽.
ISBN
1933988177
.
- ↑
“GNU/Linux Semantic Storage System”
(PDF)
. 《glscube.org》. 2010年 6月 1日에
原本 文書
(PDF)
에서 保存된 文書.
- ↑
“Apache Lucene - Query Parser Syntax”
. 《lucene.apache.org》. 2017年 5月 2日에
原本 文書
에서 保存된 文書.
- ↑
J. Beel, S. Langer, and B. Gipp, “The Architecture and Datasets of Docear’s Research Paper Recommender System,” in Proceedings of the 3rd International Workshop on Mining Scientific Publications (WOSP 2014) at the ACM/IEEE Joint Conference on Digital Libraries (JCDL 2014), London, UK, 2014
- ↑
Perner, Petra (2007). 《Machine Learning and Data Mining in Pattern Recognition: 5th International Conference》. Springer. 387쪽.
ISBN
978-3-540-73498-7
.
- ↑
“The Future of Compass & Elasticsearch”
. 《the dude abides》 (英語). 2015年 10月 15日에
原本 文書
에서 保存된 文書
. 2015年 10月 14日에 確認함
.
- ↑
Wayner, Peter.
“11 cutting-edge databases worth exploring now”
. InfoWorld. 21 September 2015에
原本 文書
에서 保存된 文書
.
21 September
2015에 確認함
.
- ↑
“Elasticsearch: RESTful, Distributed Search & Analytics - Elastic”
. 《elastic.co》. 8 October 2015에
原本 文書
에서 保存된 文書
.
23 September
2015에 確認함
.
- ↑
Marvin Humphrey.
“KinoSearch - Search engine library. - metacpan.org”
. 《p3rl.org》
. 2015年 9月 23日에 確認함
.
- ↑
가
나
Natividad, Angela.
“Socialtext Updates Search, Goes Kino”
. CMS Wire. 2012年 9月 29日에
原本 文書
에서 保存된 文書
. 2011年 5月 31日에 確認함
.
- ↑
Diment, Kieren; Trout, Matt S (2009). 〈Catalyst Cookbook〉. 《The Definitive Guide to Catalyst》.
Apress
. 280쪽.
ISBN
978-1-4302-2365-8
.
- ↑
“HMDB: a knowledgebase for the human metabolome”
. 《
Nucleic Acids Res.
》
37
(Database issue): D603?10. January 2009.
doi
:
10.1093/nar/gkn810
.
PMC
2686599
.
PMID
18953024
.
- ↑
“T3DB: a comprehensively annotated database of common toxins and their targets”
. 《Nucleic Acids Res.》
38
(Database issue): D781?6. January 2010.
doi
:
10.1093/nar/gkp934
.
PMC
2808899
.
PMID
19897546
.
- ↑
“PoweredBy”
. 《apache.org》. 21 September 2015에
原本 文書
에서 保存된 文書
.
23 September
2015에 確認함
.
外部 링크
[
編輯
]