사이트맵스

위키百科, 우리 모두의 百科事典.

사이트맵스 (Sitemaps) 프로토콜은 웹마스터가 크롤링 통해 利用 可能한 웹사이트 相議 URL 에 關해 檢索 엔진에 情報를 提供할 수 있게 하는 프로토콜이다. 사이트맵은 사이트에 對한 URL을 羅列해놓은 XML 파일이다. 웹마스터가 個別 URL의 追加 情報를 包含할 수 있게 한다: 마지막으로 업데이트될 때 얼마나 자주 變更되는지, 다른 사이트 URL과의 聯關性이 얼마나 重要한지에 關한 情報. 이를 통해 檢索 엔진은 사이트를 더 效率的으로 크롤링할 수 있고 사이트 內容의 나머지 部分으로부터 分離가 可能한 URL을 찾아낼 수 있다. 사이트맵스 프로토콜은 URL 包含 프로토콜이며 URL 除外 프로토콜인 robots.txt 를 補完한다.

歷史 [ 編輯 ]

구글은 2005年 6月 사이트맵스 0.84를 선보였으며 웹 開發者들은 自身들의 사이트의 링크들을 揭示할 수 있었다. 구글, 야후!, 마이크로소프트는 2006年 11月 사이트맵스 프로토콜의 共同 支援을 發表하였다. 스키마 버전은 사이트맵 0.90으로 變更되었으나 其他 變更事項은 없었다.

2007年 4月, Ask.com과 IBM은 사이트맵스의 支援을 發表하였다. 구글, 야후, MSN은 robots.txt를 통한 사이트맵의 自動 感知를 發表하였다. 2007年 5月, 美國의 애리조나舊, 캘리포니아州, 유타州, 버지니아州 政府는 自體 웹사이트에서 사이트맵스를 利用할 것이라 發表하였다.

사이트맵스 프로토콜은 크롤러 親和 웹 서버 [1] 의 槪念에 基盤을 두며 [2] robots.txt 을 통한 自動 感知, 페이지 變化의 주기와 優先順位 指定 機能을 包含한 改善이 包含되었다.

파일 포맷 [ 編輯 ]

하나의 URL만을 包含하며 選擇的 태그를 모두 使用한 샘플 사이트맵은 아래와 같다.

<?xml version="1.0" encoding="utf-8"?>

<urlset
 xmlns=
"http://www.sitemaps.org/schemas/sitemap/0.9"

   xmlns:xsi=
"http://www.w3.org/2001/XMLSchema-instance"

   xsi:schemaLocation=
"http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd"
>

    <url>

        <loc>
http://example.com/
</loc>

        <lastmod>
2006-11-18
</lastmod>

        <changefreq>
daily
</changefreq>

        <priority>
0.8
</priority>

    </url>

</urlset>

各州 [ 編輯 ]

  1. O. Brandman, J. Cho, Hector Garcia-Molina , and Narayanan Shivakumar (2000). 〈Crawler-friendly web servers〉. 《Proceedings of ACM SIGMETRICS Performance Evaluation Review, Volume 28, Issue 2》. doi : 10.1145/362883.362894 .  
  2. M.L. Nelson; J.A. Smith; del Campo; H. Van de Sompel; X. Liu (2006). 〈Efficient, Automated Web Resource Harvesting〉 (PDF) . 《WIDM'06》.  

外部 링크 [ 編輯 ]