2011年初,網友yixuan統計出了《全宋詞》中的高頻詞語,并在自己的博客做出一個特別的排行榜,“東風”一詞以出現1382次的頻率高居榜首,“何處”、“人間”兩詞語分列二三名,從東風、萬里到斷腸等等,隨機的詞語組合在一起便可成就一首意境優美的宋詞,這使得眾多網友詩意大發,在網絡掀起一股一秒鐘變詩人的熱潮,這個排行榜被網友稱為“宋詞密碼”。 [1]
yixuan沒有過多的時間從《全宋詞》文本中做人工統計,于是想出一個土辦法。宋詞的句子都很短,最常見的詞語一般是兩三個字,比如“猶解嫁東風”這句話,可能的2字組合是“猶解”、“解嫁”、“嫁東”、“東風”,3字組合是“猶解嫁”、“解嫁東”、“嫁東風”。如果把每句話可能的字的組合都列舉出來,就可以整體統計頻率了。根據這個思路,yixuan用R語言編出一個程序,統計出《全宋詞》中出現頻率最高的100個詞語。[1]
在“yixuan”貼出的高頻詞中,排在前面的分別是:1、14852、東風(1382)3、何處(1230)4、人間(1202)5、風流(857)6、歸去(812)7、春風(802)8、西風(779)9、歸來(771)10、江南(765)。[2]而里面會有很多無意義字的組合,不過這類詞語本身的出現就是一個偶然,所以可以預期的是它們整體的頻數會很低,使用頻率極少。
該榜單面世之后,立刻得到眾多網友的回復,紛紛稱贊yixuan“很牛”。同時網友們也發現,只需隨機選擇幾個排行榜中的詞語,便可拼湊出一句句華麗又優美的短句,不少網友便開始火熱造詞了。“14、15、92、65,回首明月,悠悠心事中”;“梅花悠悠,春風人間無限,何處鴛鴦”……
很快,各種流派的“新宋詞”不斷涌現,網友們紛紛表示,“背熟了隨便拿幾個詞拼起來就能出口成詩了。太好玩兒了。”
其中網友“達芬奇的雞蛋”將圓周率的數字,與“宋詞”的高頻詞表序號一一對照,“創作”出一首《清平樂·圓周率》,還將之一一注明,“回首明月(一看就是抒情詩),悠悠心事空(果然,貌似失戀了),西湖何事寂寞中(觸景生情),風吹斜陽匆匆(回憶那天下午的艷遇),芳草平生斜陽(平生見過最美的太陽和芳草,都是因為那里有你的身影),風吹寂寞今日(到現在就剩我自己),一枝富貴年年(好花美麗年年開,好景宜人不常在),斷腸長安不知(我的思念遠方的你可知道)?
其他網友也利用這些高頻詞語,拿生日、QQ、物理常數等,套用里面的排序,來“寫詞”。“丘寒”留言道:“試著用某個號碼創作了一首:天上相思,芳草年年,昨夜江南,回首一笑多情。”
“零Ronnie”:“我的生日:年年江上,江南春風;我的手機號:明月芳草去年,江南闌干歸去……還真挺上口的!我也能做詩人了哈哈!”
有網友對yixuan留言稱,臺灣有些作者做過這個事情,他們是通過中文分詞,然后統計的頻率。其中包括了單個字的意向,比如月、花等。網友稱贊yixuan的這種方法,化繁為簡。[2]
寫宋詞能如此簡單速成,一些理科生網友甚至網上都出現了這樣的“宣言”:“理科宅男們‘消滅’文科生的日子到來了!拿起你的計算器,‘消滅’文藝青年吧!”
還有網友表示:“人類已經無法阻止理科生了!”不過,優美的詩詞被如此“技術化”,也讓文科生網友“雯名霞邇”大叫:“這讓學中文的人情何以堪啊!”
“沌世界”說:“不知宋詞的粉絲看了是不是有一種偶像破滅的感覺。”
也有網友“一路人”冷靜表示:“早就有人發現,這樣可以自動組合出類似于婉約派的詞。但是豪放派那種‘大江東去,浪淘盡,千古風流人物’的氣勢,光靠電腦是組合不出來的!”
對于網友的熱議,yixuan在自己的博客發博表示澄清,并對大家熱情這么高感到高興,因為這至少說明他所做的一些東西是有意義的。yixuan稱自己學的專業是統計和精算,平時會和各種類型的數據打交道,想利用學到的專業知識來對一些實際的問題進行分析。而沒有意料到的是大家對這件事的關注度會這么高。 [2]
對于網友們的創作,中國現當代文學研究方向碩士生導師張放也不禁感嘆:“很有才啊。”同時張放也表示,通過高頻詞組合的新宋詞可能在形式上接近宋詞的形式,但是其中蘊含的精神則是一時間不能被模仿的,現在流傳下來的優秀作品都是經過時間考驗的,因為其中包含了當時的時代精神,像蘇軾、岳飛的很多詞就非常憂國憂民。就算是花間流派,它也有一種精神韻味在里面。張放直言,網友們的創作學到了宋詞的形式,其中可能會出現好的作品,但離神似還有距離。
張放表示,宋詞已經不符合當代文學樣式了,宋詞已經是歷史了,現在就算作得再好也沒有現實意義,因為它不具備時代精神。同時,張放也非常鼓勵網友積極創作,作為自己練筆、娛樂或是對宋詞的懷念都好。[1]
1 1485 51 天上 368
2 東風 1382 52 楊柳 362
3 何處 1230 53 西湖 356
4 人間 1202 54 桃花 354
5 風流 857 55 扁舟 353
6 歸去 812 56 消息 351
7 春風 802 57 憔悴 344
8 西風 779 58 何事 339
9 歸來 771 59 芙蓉 338
10 江南 765 60 神仙 334
11 相思 753 61 一片 334
12 梅花 732 62 桃李 333
13 千里 676 63 人生 332
14 回首 656 64 十分 331
15 明月 651 65 心事 329
16 多少 648 66 黃花 328
17 如今 642 67 一聲 325
18 闌干 630 68 佳人 324
19 年年 613 69 長安 321
20 萬里 590 70 東君 319
21 一笑 582 71 斷腸 316
22 黃昏 550 72 而今 315
23 當年 542 73 鴛鴦 314
24 天涯 537 74 為誰 313
25 相逢 528 75 十年 310
26 芳草 527 76 去年 309
27 尊前 516 77 少年 308
28 一枝 512 78 海棠 307
29 風雨 505 79 寂寞 306
30 流水 472 80 無情 306
31 依舊 472 81 不是 305
32 風吹 471 82 時候 304
33 風月 461 83 腸斷 303
34 多情 457 84 富貴 303
35 故人 451 85 蓬萊 303
36 當時 450 86 昨夜 303
37 無人 445 87 行人 302
38 斜陽 438 88 今夜 301
39 不知 430 89 誰知 300
40 不見 429 90 不似 299
41 深處 422 91 江上 298
42 時節 403 92 悠悠 296
43 平生 398 93 幾度 295
44 凄涼 398 94 青山 295
45 春色 394 95 何時 294
46 匆匆 383 96 天氣 293
47 功名 383 97 惟有 293
48 一點 378 98 一曲 291
49 無限 377 99 月明 291
50 今日 369 100 往事 290[3]
排在第一的是無效字符,所以只有數字,跟數據源有關。