在推特上我關注的人 72% 都是男性
至少,這是我的估計。推特並不會詢問用戶的性別,因此我 寫了一個程序 ,根據姓名猜測他們的性別。在那些關注我的人當中,性別分布甚至更糟,83% 的是男性。據我所知,其他的還不全都是女性。
修正第一個數字並不是什麼神秘的事:我注意尋找更多支持我興趣的女性專家,並且關注他們。
另一方面,第二個數字,我只能只能輕微影響一點,但是我也打算改進下。我在推特上的關係網應該代表的是軟體行業的多元化未來,而不是不公平的現狀。
我應該怎麼估算呢
我開始估算我關注的人(推特的上的術語是「朋友」)的性別分布,然後發現這格外的難。推特的分析給我展示了如下的結果, 關於關注我的人的性別估算:
因此,推特的分析將我的關注者分成了三類:男性、女性、未知,並且給我們展示了前面兩組的比例。(性別二值化現象在這裡並不存在——未知性別的人都集中在組織的推特賬號上。)但是我關注的人的性別比例,推特並沒有告訴我。 而這就是可以改進的,然後我開始搜索能夠幫我估算這個數字的服務,最終發現了 FollowerWonk 。
FollowerWonk 估算我關注的人裡面有 71% 都是男性。這個估算準確嗎? 為了評估一下,我把 FollowerWonk 和 Twitter 對我關注的人的進行了估算,結果如下:
推特分析
男性 | 女性 | |
---|---|---|
我的關注者 | 83% | 17% |
FollowerWonk
男性 | 女性 | |
---|---|---|
我的關注者 | 81% | 19% |
我關注的人 | 72% | 28% |
FollowerWonk 的分析顯示我的關注者中 81% 的人都是男性,很接近推特分析的數字。這個結果還說得過去。如果FollowerWonk 和 Twitter 在我的關注者的性別比例上是一致的,這就表明 FollowerWonk 對我關注的人的性別估算也應當是合理的。使用 FollowerWonk 我就能養成估算這些數字的愛好,並且做出改進。
然而,使用 FollowerWonk 檢測我關注的人的性別分布一個月需要 30 美元,這真是一個昂貴的愛好。我並不需要FollowerWonk 的所有的功能。我能很經濟的解決只需要性別分布的問題嗎?
因為 FollowerWonk 的估算數字看起來比較合理,我試圖做一個自己的 FollowerWonk 。使用 Python 和一些好心的費城人寫的 Twitter API 封裝類(LCTT 譯註:Twitter API 封裝類是由 Mike Taylor 等一批費城人在 github 上開源的一個項目),我開始下載我所有關注的人和我所有的關注者的簡介。我馬上就發現推特的速率限制是很低,因此我隨機的採樣了一部分用戶。
我寫了一個初步的程序,在所有我關注的人的簡介中搜索一個和性別相關的代詞。例如,如果簡介中包含了「she」或者「her」這樣的字眼,可能這就屬於一個女性,如果簡介中包含了「they」或者「them」,那麼可能這就是性別未知的。但是大多數簡介中不會出現這些代詞。對於這種簡介,和性別關聯最緊密的信息就是姓名了。例如:@gvanrossum 的姓名那一欄是「Guido van Rossum」,第一姓名是「Guido」,這表明 @gvanrossum 是一個女的。當找不到代詞的時候,我就使用名字來評估性別估算數字。
我的腳本把每個名字的一部分傳到性別檢測機中去檢測性別。性別檢測機也有可預見的失敗,比如錯誤的把「Brooklyn Zen Center」當做一個名叫「Brooklyn」的女性,但是它的評估結果與 FollowerWonk 和 Twitter 的相比也是很合理的:
非男非女 | 男性 | 女性 | 性別未知的 | |
---|---|---|---|---|
我關注的人 | 1 | 168 | 66 | 173 |
0% | 72% | 28% | ||
我的關注者 | 0 | 459 | 108 | 433 |
0% | 81% | 19% |
(數據基於我所有的408個關注的人和1000個關注者。)
了解你的數字
我想你們也能檢測你們推特關係網的性別分布。所以我將「Proportional」應用發布到 PythonAnywhere 這個便利的服務上,每月僅需 10 美元:
這個應用可能會在速率上有限制,超過會失敗,因此請溫柔的對待它。github 上放了源代碼代碼 ,也有命令行的工具。
是誰代表了你的推特關係網?你還在忍受那些在過去幾十年里一直在談論的軟體行業的不公平的男女分布嗎?或者你的關係網看起來像軟體行業的未來嗎?讓我們了解我們的數字並且改善他們。
via: https://emptysqua.re/blog/gender-of-twitter-users-i-follow/
作者:A. Jesse Jiryu Davis 譯者:Flowsnow 校對:wxy
本文轉載來自 Linux 中國: https://github.com/Linux-CN/archive