•  


GitHub - coleifer/micawber: a small library for extracting rich content from urls
Skip to content

coleifer/micawber

Repository files navigation

image

A small library for extracting rich content from urls.

what does it do?

micawber supplies a few methods for retrieving rich metadata about a variety of links, such as links to youtube videos. micawber also provides functions for parsing blocks of text and html and replacing links to videos with rich embedded content.

examples

here is a quick example:

import
 micawber


# load up rules for some default providers, such as youtube and flickr

providers
 =
 micawber
.
bootstrap_basic
()

providers
.
request
(
'http://www.youtube.com/watch?v=54XHDUOHuzU'
)

# returns the following dictionary:

{
    
'author_name'
: 
'pascalbrax'
,
    
'author_url'
: 
u'http://www.youtube.com/user/pascalbrax'

    'height'
: 
344
,
    
'html'
: 
u'<iframe width="459" height="344" src="http://www.youtube.com/embed/54XHDUOHuzU?fs=1&feature=oembed" frameborder="0" allowfullscreen></iframe>'
,
    
'provider_name'
: 
'YouTube'
,
    
'provider_url'
: 
'http://www.youtube.com/'
,
    
'title'
: 
'Future Crew - Second Reality demo - HD'
,
    
'type'
: 
u'video'
,
    
'thumbnail_height'
: 
360
,
    
'thumbnail_url'
: 
u'http://i2.ytimg.com/vi/54XHDUOHuzU/hqdefault.jpg'
,
    
'thumbnail_width'
: 
480
,
    
'url'
: 
'http://www.youtube.com/watch?v=54XHDUOHuzU'
,
    
'width'
: 
459
,
    
'version'
: 
'1.0'
,
}

providers
.
parse_text
(
'this is a test:
\n
http://www.youtube.com/watch?v=54XHDUOHuzU'
)

# returns the following string:

this
 is
 a
 test
:
<
iframe
 width
=
"459"
 height
=
"344"
 src
=
"http://www.youtube.com/embed/54XHDUOHuzU?fs=1&feature=oembed"
 frameborder
=
"0"
 allowfullscreen
>
<
/
iframe
>


providers
.
parse_html
(
'<p>http://www.youtube.com/watch?v=54XHDUOHuzU</p>'
)

# returns the following html:

<
p
>
<
iframe
 width
=
"459"
 height
=
"344"
 src
=
"http://www.youtube.com/embed/54XHDUOHuzU?fs=1&amp;feature=oembed"
 frameborder
=
"0"
 allowfullscreen
=
"allowfullscreen"
>
<
/
iframe
>
<
/
p
>
- "漢字路" 한글한자자동변환 서비스는 교육부 고전문헌국역지원사업의 지원으로 구축되었습니다.
- "漢字路" 한글한자자동변환 서비스는 전통문화연구회 "울산대학교한국어처리연구실 옥철영(IT융합전공)교수팀"에서 개발한 한글한자자동변환기를 바탕하여 지속적으로 공동 연구 개발하고 있는 서비스입니다.
- 현재 고유명사(인명, 지명등)을 비롯한 여러 변환오류가 있으며 이를 해결하고자 많은 연구 개발을 진행하고자 하고 있습니다. 이를 인지하시고 다른 곳에서 인용시 한자 변환 결과를 한번 더 검토하시고 사용해 주시기 바랍니다.
- 변환오류 및 건의,문의사항은 juntong@juntong.or.kr로 메일로 보내주시면 감사하겠습니다. .
Copyright ⓒ 2020 By '전통문화연구회(傳統文化硏究會)' All Rights reserved.
 한국   대만   중국   일본