從《小豬佩奇》看英語動畫片的難度分級

2022-7-22 23:10 原創(chuàng) · 圖片2

我們家娃的英語習得實踐之一就是在三歲起到現在以動畫片作為主要的英語輸入方式之一。

在這個實踐中,我一直在尋找兩個問題的答案:

  1. 當前或是下一部適合孩子看的動畫片是什么?
  2. 通過看動畫片來習得英語的路線是如何的?其終極水平在哪里?

毫無疑問, 如果動畫片能像閱讀那樣有分級的話 ,動畫片分級就能夠幫助回答上述兩個問題。但是,遺憾的是動畫片尚沒有針對語言難度的分級。

既然沒有現成的,那就自己動手、豐衣足食吧!

最近一段時間,我分析了幾十部英文動畫片的語言難度,并基于分析結果,對動畫片的難度進行了劃分。

本文會對動畫片的難度因素進行討論,下一篇文章《英語動畫片的分級》會給出動畫片的分級。

難度的因素

一部動畫片的難度主要由以下三個因素決定:詞匯量,難詞占比以及語速。

詞匯量

不難想到,一部動畫片里出現的詞匯量越多,該動畫片可能越難。比如,《小豬佩奇》(Peppa Pig)的詞匯量是2190個,而 《小鼠波波》(Maisy) 的詞匯量是1039個。注:在我的分析中,同樣的lemma*被計為一個單詞,這樣得到的詞匯量的估算會更緊實些。

[*]什么是lemma?可以通過去除詞匯的屈折變化(inflection,英語中的屈折變化:對于動詞來說,plays/played/playing是play的屈折變化;對于名詞來說,cars是car的屈折變化 ;對于形容詞來說,bigger/biggest是big的曲折變化),而只計入原形的方式來精簡詞匯量。這種原形單詞(play、car及big)被稱為lemma。英語的詞匯(已除去專有名詞)在進行這種方式的精簡之后會減少到原來數目的60%左右。

難詞占比

雖然詞匯量是衡量動畫片的重要因素,但是,詞匯量不是唯一的因素。比如, 有兩部動畫片A和B。A的片長是100分鐘,詞匯量是100個;B的片長是2000分鐘,而詞匯量是200個。雖然動畫片B的詞匯量多,但很難說動畫片B比動畫片A難。動畫片B的詞匯多的原因很有可能是由于其片長長,所以,動畫片B中出現更多的故事,更多的場景,導致了更多的詞匯。 因此,更科學的衡量動畫片難度的方法是難詞占比,即各種難度的詞在單詞總量中出現的比例。

顯然,難詞占比大的動畫片比難詞占比小的要難。具體的分析方法,詳見附錄。

語速

顯然,語速越快,動畫片可能越難。

不妨以娃現在看的動畫片《小豬佩奇》為例來分析英語動畫片的難度。

  1. 詞匯量:

《小豬佩奇》里的詞匯量是2190個, 詞匯在前10000個詞匯里的分布如下,

《小豬佩奇》的詞匯在前10000個高頻詞里的分布

圖中有100行、100列,即10000個方格。每個方格代表一個單詞(其頻率從下到上,從左到右逐漸減少)。若動畫片中有此方格對應的單詞,則該單元格的顏色為彩色;否則,為灰度色。

2. 難詞占比:

《小豬佩奇》里出現的2190個詞匯,

前2000個高頻詞在其總的詞匯量中的占比是46.35%

前2001位到前4000位的高頻詞在其總的詞匯量中的占比是18.22%。

3. 語速:

語速的度量是很簡單的,就是每分鐘的單詞數(Words Per Minute) = 單詞總數/講話的總時間。但是,這里需要注意的是講話的總時間并不是動畫片的時長,而應該是去掉片中音樂、無聲音、哭笑聲及長時間的感嘆詞部分之后的時長。《小豬佩奇》的平均每分鐘的單詞量為162個。

未完待續(xù)。下一篇 《英語動畫片的分級》中會給出分級標準和各個級別的代表動畫片。

附錄

本文中使用的難詞占比的分析方法:

1 使用詞頻來衡量詞的難度

使用美國當代語料庫的詞頻順序 ,認為高頻詞比低頻詞簡單。

2 難詞占比的計算

前2000個高頻詞占比=前2000個高頻詞的個數/單詞的總數目

第2001位高頻詞到第3000位高頻詞占比=第2001位高頻詞到第3000位高頻詞的個數/單詞的總數目

類似的計算第3001位到4000位高頻詞占比。

上述計算中,單詞的數目為不重復出現的單詞的數量。

顯然,高頻詞比低頻詞簡單。高頻詞占比越大,動畫片越簡單。

如果文章對您有所幫助,不妨點贊、評論和轉發(fā)一下。感謝您的支持。

更多寶寶的外語習得知識,請訪問 同名微信公眾號 寶寶的外語習得


閱讀原文 回應 舉報
贊1
收藏7

推薦閱讀

寶寶的外語習得
寶寶的外語習得
2018