网络正在影响计算机语言学研究。《科学人》杂志报道,在新加坡举行的计算语言学会上,麻省理工学院的研究人员发表了他们的研究——利用计算机自动生成维基百科文章 http://people.csail.mit.edu/regina/my_papers/wiki.pdf 。
研究人员首先搜集维基百科中与美国影星、疾病相关文章,各2150篇和523篇。这些文章通常有四段,每段约200字。他们用这些资料训练电脑自动分析文章结构、搜集各段落资料、选择切题文句、组合文句撰写文稿。例如,要写「细菌性血管瘤病」的维基百科文章,电脑首先以“bacillary angiomatosis diagnosis”为关键字,在搜索引擎上收集“细菌性血管瘤病”的“诊断”段落相关资料。之后,电脑考虑文句对此段落是否适切,对整体文章是否过于重复等因素,组合成为几个段落的文章。评估分析显示电脑自动生成文章的信息与品质,非常接近真人写出的文章。或许学术评估方式不足采信,需要真实考验。因此,研究者把15篇自动生成的疾病主题文章,公布到维基百科上。按照维基百科的政策,这些刚录入的短文,一概分类标示为“小作品”(stub),意味着文章还需要扩充。最终这15篇电脑生成文章,在英文维基百科正常存活——并引来许多维基用户参与修改增删,短时间内大部份内容的质与量大大提升。维基百科管理者也就拿掉“小作品”标签,晋升10篇疾病简介为正式文章。
所以你下次浏览英文维基百科时看到的文章,可能就是电脑起头撰写的。
新闻转载:计算机自动生成医学文章——且被维基百科接受
- luojie-dune
- 帖子: 22033
- 注册时间: 2007-07-30 18:28
- 系统: Linux
- 来自: 空气中
- xiooli
- 帖子: 6956
- 注册时间: 2007-11-19 21:51
- 来自: 成都
- 联系:
Re: 新闻转载:计算机自动生成医学文章——且被维基百科接受
能写论文就好鸟 

- szyzln
- 帖子: 910
- 注册时间: 2008-10-31 15:28
- 来自: 中国上海
- 联系:
- bbeikke
- 帖子: 880
- 注册时间: 2008-10-14 21:54
-
- 帖子: 8
- 注册时间: 2009-05-28 11:09
Re: 新闻转载:计算机自动生成医学文章——且被维基百科接受
惭愧
我的毕业论文也是这么处理的 早知如此就请这位电脑兄帮忙了 还节省时间呢 


-
- 帖子: 18311
- 注册时间: 2008-01-09 22:41
Re: 新闻转载:计算机自动生成医学文章——且被维基百科接受
要点不是说wiki审核机制,而是生成文章过程,牛!
- xxzc
- 帖子: 151
- 注册时间: 2009-01-26 17:45
- 联系: