Linux中國

LinkArchiver:自動提交鏈接給互聯網檔案(Internet Archive)

互聯網是永遠的,當發生下面的情況的就不是了。 「鏈接腐爛」 - 當頁面移動或者站點離線,隨著時間的流逝,到網站的有效鏈接就會斷開 - 對於嘗試在線做研究的人來說,這是一個真正的問題。 互聯網檔案館 Internet Archive 通過在它的「 時光機 Wayback Machine 」中提供提交的內容來幫助解決這個問題。

當然,困難的是讓人們記得提交檔案鏈接。

這就是 Parker Higgins 的新 Twitter 機器人所切入的地方。@LinkArchiver 會自動提交關注了 互聯網檔案館 Internet Archive 的帳戶所提交的鏈接。如果一個 Twitter 用戶關注了 @LinkArchiver,它會回關,即使用戶取消關注機器人,它也會繼續添加鏈接。這意味著在 Twitter 上共享的鏈接可以永久保存,用戶不用擔心。

無需留意這個方面對 Higgins 非常有吸引力。他對 Opensource.com 說:「我對整個裝置的被動程度非常在意。如果你依靠人們選擇什麼是重要的來存檔,你會錯過很多最重要的東西,只要抓取每個發表鏈接的副本,這個機器人應該有助於確保我們不會錯過上下文。」

在最初開發機器人之後,Higgins 聯繫了 互聯網檔案館 Internet Archive 。他對自動化造成問題的擔憂很快被消除。儘管他在請求時給 API 請求用了一個自定義的用戶代理字元串,但是他說:「他們處理的流量實際上是個舍入錯誤。」擴展性的問題在 Twitter 方面:其服務限制了帳戶的關注者數量和新關注者的比例。這限制了 LinkArchiver 的單個實例的能力。

幸運的是,LinkArchiver 以 AGPLv3 授權在 GitHub 上發布。

有了一台小的伺服器和一個 Twitter 賬號, 任何人都可以運行這個機器人。Higgins 設想人們運行一個關注特定的興趣或社交圈子的 LinkArchiver 的實例。「發生在我身上的一件事是,你可以關閉回關行為,並關注特定的組或者興趣。例如,機器人可以關注一群朋友或同學,或主要媒體,或每一個美國參議員和代表,並存檔他們發表的 tweet。」

這不是 Higgins 第一次寫 Twitter 機器人:@securethenews@pomological 以及受歡迎的 @choochoobot 是他之前的作品。這些機器人都是只寫的。 LinkArchiver 是他開發的第一個互動機器人,這需要學習幾種新技能。這是 Higgins 參與 Recurse Center 的一部分,這是為程序員進行的為期 12 周的活動。

Higgins 鼓勵大家的拉取請求以及其他的 LinkArchiver 機器人實例。

(題圖:Beatrice Murch 拍攝的 Inernet Archive 總部; CC BY (on Flickr))

作者簡介:

Ben Cotton - Ben Cotton 是一個受訓過的氣象學家和一名高性能計算機工程師。Ben 在 Cycle Computing 做技術傳教士。他是 Fedora 用戶和貢獻者,合作創辦當地的一個開源集會,是一名開源倡議者和軟體自由機構的支持者。他的推特 (@FunnelFiasco)

via: https://opensource.com/article/17/7/linkarchiver-automatically-submits-links-internet-archive

作者:Ben Cotton 譯者:geekpi 校對:wxy

本文由 LCTT 原創編譯,Linux中國 榮譽推出


本文轉載來自 Linux 中國: https://github.com/Linux-CN/archive

對這篇文章感覺如何?

太棒了
0
不錯
0
愛死了
0
不太好
0
感覺很糟
0
雨落清風。心向陽

    You may also like

    Leave a reply

    您的郵箱地址不會被公開。 必填項已用 * 標註

    此站點使用Akismet來減少垃圾評論。了解我們如何處理您的評論數據

    More in:Linux中國