手机努比亚z9:《全宋词》高频词语

来源:百度文库 编辑:偶看新闻 时间:2024/05/04 05:46:41

网友统计制作“宋词密码”

2011年12月01日 09:35   来源:中国新闻网   雍铃子[我要发表评论][推荐朋友][打印本稿][字号 大 中 小].h1 {FONT-WEIGHT: bold; TEXT-JUSTIFY: inter-ideograph; FONT-SIZE: 22pt; MARGIN: 17pt 0cm 16.5pt; LINE-HEIGHT: 240%; TEXT-ALIGN: justify}.h2 {FONT-WEIGHT: bold; TEXT-JUSTIFY: inter-ideograph; FONT-SIZE: 16pt; MARGIN: 13pt 0cm; LINE-HEIGHT: 173%; TEXT-ALIGN: justify}.h3 {FONT-WEIGHT: bold; TEXT-JUSTIFY: inter-ideograph; FONT-SIZE: 16pt; MARGIN: 13pt 0cm; LINE-HEIGHT: 173%; TEXT-ALIGN: justify}DIV.union {FONT-SIZE: 14px; LINE-HEIGHT: 18px}DIV.union TD {FONT-SIZE: 14px; LINE-HEIGHT: 18px}    “回首明月,悠悠心事空”;“东风何处在人间”……这些优美的辞藻都能信手拈来了!近日,网友yixuan统计出了《全宋词》中的高频词语,并将之做出了一个特别的排行榜,堪称“宋词密码”。从东风、万里到断肠……随机的词语组合在一起便可成就一首意境优美的宋词,这使得众多网友诗意大发,在网络掀起一股一秒钟变诗人的热潮。

    大侠“神经”之作统计《全宋词》高频词

    “再次神经短路,突然想看看宋词里面什么样的意象是最常见的,比如可以做个频率分析什么的。”今年初,网友yixuan将《全宋词》中的高频词统计出来,并在个人博客中贴出了一排密密麻麻的数据,“东风”以出现1382次的频率高居榜首,“何处”、“人间”分列二三名。

    yixuan介绍说,自己没有过多的时间从《全宋词》文本中做人工统计,于是想出一个土办法。“宋词的句子都很短,最常见的词语一般是两三个字,比如‘犹解嫁东风’这句话,可能的2字组合是‘犹解’、‘解嫁’、‘嫁东’、‘东风’,3字组合是‘犹解嫁’、‘解嫁东’、‘嫁东风’。如果把每句话可能的字的组合都列举出来,就可以整体统计频率了。”根据这个思路,yixuan用R语言(主要用于统计分析、绘图的语言和操作环境)编出一个程序,统计出《全宋词》中出现频率最高的100个词语。

    不过yixuan也表示,“当然里面会有很多无意义字的组合,不过这类‘词语’本身的出现就是一个偶然,所以可以预期的是它们整体的频数会很低,是入不了‘大雅之堂’的。”

    网友“造词”有感随意组合便有优美短句

    该榜单面世之后,立刻得到众多网友的回复,纷纷称赞yixuan“很牛”。同时网友们也发现,只需随机选择几个排行榜中的词语,便可拼凑出一句句华丽又优美的短句,不少网友便开始火热造词了。“14、15、92、65,回首明月,悠悠心事中”;“梅花悠悠,春风人间无限,何处鸳鸯”……

    一时间,各种流派的“新宋词”不断涌现,网友们纷纷表示,“背熟了随便拿几个词拼起来就能出口成诗了。太好玩儿了。”

    除了凑热闹的网友,其中也不乏专业人士,“台湾有些作者做过这个事情,他们是通过中文分词,然后统计的频率。其中包括了单个字的意向,比如月、花等。非常赞你的这种方法,化繁为简啊。我当初还找人要分词后的宋词,结果别人不给;你这个方法倒是绕过去了啊。”

    专家意见>>>

    形似神不似可练笔娱乐

    对于网友们的创作,中国现当代文学研究方向硕士生导师张放也不禁感叹:“很有才啊。”同时张放也表示,通过高频词组合的新宋词可能在形式上接近宋词的形式,但是其中蕴含的精神则是一时间不能被模仿的,“现在流传下来的优秀作品都是经过时间考验的,因为其中包含了当时的时代精神,像苏轼、岳飞的很多词就非常忧国忧民。就算是花间流派,它也有一种精神韵味在里面。”张放直言,网友们的创作学到了宋词的形式,“其中可能会出现好的作品,但离神似还有距离。”

    不过,张放也坦言,宋词已经不符合当代文学样式了,“宋词已经是历史了,现在就算作得再好也没有现实意义,因为它不具备时代精神。”同时,张放也非常鼓励网友积极创作,“作为自己练笔好、娱乐或是对宋词的怀念都好。”