“人類”是男還是女?
admin
2022-04-23 00:22:39
0

原標題:"人類"是男還是女? <!---->

作者|家養蛋糕

當提到人、人類、個體等概念時,你腦海中出現的是男人還是女人?

類似的,在英文中,當提到person、people、individual時,你直覺認為指代的是woman還是man?

如果我們總是將性別中立的、指代所有人的詞彙認為是指代男性的,這是不是意味著,我們認為"人類"中男人是默認選項?

這看起來是個荒謬的類比推理,人類當然不可能全部都是男性… 但是,2022年4月1號(沒錯,就是這麼巧,這不是愚人節的玩笑)發表在Science Advances上的一項研究表明——

在使用"人類"這個詞的時候,人們的確更傾向於默認"人類"是男性。 對於"人類"的集體概念不是性別中立而是男性優先的。

話語中的性別偏好

通過語義看思維

許多語言學研究建立在這樣一個基本假設之上:語義的本質是詞語所指代的心理概念。 這些心理概念既能够反映思維,也能够塑造思維。 這也就意味著,分析人們說話的內容時,我們所分析的其實可以是語言背後的思維

這一假設適用於個人,也同樣適用於集體。 來自於大規模群體的語言素材能够反映出一個語言社區的集體概念。 一群人的語言習慣有哪些? 這群人如何表達自己的想法? 這些都能體現作為一個語言社區的的社會觀念和價值系統,以及藏匿於其中的社會偏好

本研究所關注的就是其中的一種社會偏差——人們默認"人類"是男性,而女性則被視作對"人類"默認内容的一種偏離。

一些樣本量較小的心理學研究表明,當參與者被要求舉出"人類"的例子時,更多的參與者描述的對象是男人而不是女人; 更多的參與者用男人(而非女人)來代表人類…

一些大規模的語言學研究也表明,英語使用者更經常使用"他"(he)而不是"她"(she),但是這種簡單的詞頻差异也可能是由於語法習慣而不是性別偏差所造成的。

就現有研究而言,對於"人類"詞語的性別偏差的證據尚不充分,缺乏大規模的直接研究。 囙此,研究者使用語義分析的管道,對人類有關目標詞的性別偏差進行了詳盡的探索。

詞向量化

語義分析方法

就像人類做閱讀理解一樣,機器也是通過脉络來表徵詞義的。

對於"我今天吃了一個布嚕嚕"這樣的句子,即使我們沒有見過布嚕嚕這個詞,我們可以從上下文當中得知,布嚕嚕大概是種能吃的東西。

機器學習的過程就是給機器"投喂"大量現實生活中使用的句子(語料),通過計算目標詞和周圍詞在語料中共同出現的模式來表徵目標詞語的含義。

具體而言,該研究使用的表徵語義的管道是詞向量化(word embeddings)。 通過詞向量化,語義被表徵為低維稠密的特徵向量,而這些向量間的數學關係具有可解釋的意義,例如V(king)- V(man)+ V(woman)~= V(queen)(V指向量化的映射)。

如果兩個詞語常常在類似的脉络當中出現,它們的特徵向量是比較相似的,其語義也是相似的,這被稱作語義的分佈式假說(the distributional hypothesis of word meaning)。

囙此,我們可以通過分析詞語的特徵向量來推測人們對於某一概念的理解。 通過計算兩個詞語特徵向量的余弦值,我們就能知道這兩個特徵向量有多相似(即語義相似性),進而反映出人們對兩個詞語的理解有多一致

對於研究者所關心的目標詞(指代人類的名詞、描述人類的形容詞和動詞),我們可以分別計算它們和對照詞(指代男性的詞、指代女性的詞)的相似性 並相互比較,從而得出目標詞是否具有性別偏差的結論。

有偏的名詞、形容詞和動詞

研究資料

來自the May 2017 Common Crawl corpus [CC-MAIN-2017-22],語料庫包含來自29.6億個網站超過6300億的詞語,語料的來源包含非正式文字(來自部落格、論壇等)和正式文字(來自媒體、企業、政府等)。

研究流程

1. 生成目標詞和對照詞清單(依據已有研究或編碼);

(1)目標詞:指代人類的名詞(30個,如individual)、描述人類的形容詞(538個,如extroverted)和動詞(如speak);

(2)男性對照詞:指代男性的詞(36個,如man);

(3)女性對照詞:指代女性的詞(38個,如woman)。

2. 使用fastText算灋(一種詞向量化的科技,保留了詞序資訊),選取目標詞\對照詞的向量特徵

3. 計算目標詞和男性對照詞\女性對照詞的向量特徵的余弦相似性(語義相似性);

4. 比較男性\女性(目標詞-對照詞)余弦相似性的大小。

< span style="font-size: 16px;">< span>//< strong>1. 指代人類的名詞-男性對照詞\女性對照詞

圖1余弦相似性,右邊是指代人類的名詞和男性對照詞的余弦相似,左邊是指代人類的名詞和女性對照詞的余弦相似性。 余弦相似性越接近於1,代表語義越相似。 箱形圖的邊緣代表四分比特距,超出箱形圖的線段代表全距,箱形圖內部代表95%的置信區間。 水准的灰線代表平均值,圓點代表擬合後的平均值。< strong>指代人類的名詞-女性對照詞的余弦相似性比指代人類的名詞-男性對照詞更低

結果表明,人類的語義相比於女性更接近於男性,並且這一偏好具有中等效應。

< span style="font-size: 16px;">< span>// 2.描述< strong>人類的形容詞-男性對照詞\女性對照詞

研究者進行了類似的分析,結果表明,這些描述人類的形容詞的語義相比於女性更接近於男性

研究者進行了進一步分析,根據3名評分者的評分結果,將實驗中使用的描述人類的形容詞分類為"男性刻板印象/女性刻板印象/中立"

分析表明,形容詞-對照詞的性別偏差關聯是不對稱。 也就是說,女性對照詞更傾向於和女性刻板印象形容詞語義相似; 相比於女性對照詞而言,男性對照詞的語義不受到性別刻板印象的限制,男性對照詞和更大範圍的通用形容詞共同出現在類似的脉络當中。

圖2余弦相似性,右邊是性別刻板印象形容詞和男性對照詞的余弦相似,左邊是性別刻板印象形容詞的余弦相似性。 形容詞的性別刻板印象用紅色和綠色標注,其餘統計注釋同圖1。< strong>總體來看,指代人類的形容詞-女性對照詞的余弦相似性比指代人類的名詞-男性對照詞更低; 對於男性對照詞,兩種性別刻板印象形容詞的余弦相似性沒有顯著差异; 對於女性對照詞,男性性別刻板印象形容詞的余弦相似性顯著低於女性性別刻板印象形容詞。

< span style="font-size: 16px;">< span>

相关内容