热点新闻
“听我说谢谢你”还能用古诗来说?清华搞了个“据意查句”神器,一键搜索你想要的名言警句
admin2022-07-31 05:41
382人已围观
简介“听我说谢谢你”还能用古诗来说?清华搞了个“据意查句”神器,一键搜索你想要的名言警句
艾瑞巴得,又有神器来拯救文盲了!
天气太热只会念叨一句“热死了”?发朋友圈翻来覆去才憋出几个字?这个检索神器值得了解一下。只要在搜索框里输入你想表达的意思,如“热死了”。立刻就能有 20 个表达这一意思的句子任君挑选。
句子类型还能按需选取,名言警句、歇后语、古诗文都不在话下。
并且给出的名言还会注明出处作者,这下再也不用啥话都往迅哥儿身上套了。
怪不得网友直呼:朋友圈文案高级表达查找替换系统。
而且,我们在试玩了几轮后发现,这个神器在 hold 住网络俗语“精髓”上的表现有些出人意料。
比如这两天大家都在说的“精神内耗”。它给出了一段卢梭的话,完全拿捏住了词语本来的意思,语言逼格立马提升好几度。
甚至还能找出意思相近的古诗文。来自欧阳修《秋声赋》中的这句“百忧感其心,万事劳其形,有动乎中,必遥其情”,说的意思就是焦虑使人精神疲惫。
果真是能通杀古今了。于是,我们找来了更多网络流行语喂给它,看看还能擦出什么火花~
听我说谢谢你,但古诗版
第一个要尝试的网络名句,是“听我说,谢谢你”。
神器反向输出结果中,意思最为贴近的是王维的这句“举世无相识,终身思旧恩”。这句诗中明确体现了说话主体人表达感谢之意,称得上是“听我说谢谢你”的究极上流版。
还有在句式上非常接近的结果,是温庭筠笔下的“知我意,感君怜”。
最让人意想不到的,是神器反向输出了《将进酒》里的“与君歌一曲,请君为我倾耳听”。
乍看之下,这个答案好像是错的。但要知道“听我说谢谢你”能成为梗,就是因为防疫人员尴尬被迫听歌事件…… 这么看,反向输出神器还意外扣了题。
不只是这句梗,还有很多网络用语,反向输出神器的回答都是貌似不着边际,但又让人觉得异常契合。
比如输入“无语子”,给出的诗句有:满怀心腹事,尽在不言中。
这不就是大家表达无语时的真实心境吗?因为不便明说,所以沉默,所以无语。
还有这句“你品,你细品”,输出的诗句也都带有了仔细品读、反复回味的意思。
那么,这个好用又好玩的神器,到底是什么来头呢?
来自清华的“据意查句”
以上说的这个好登西,是由清华推出的“据意查句”神器 ——WantQuotes。
诞生自清华大学计算机系自然语言处理与社会人文计算实验室(THUNLP),项目指导教师为孙茂松教授和刘知远副教授。
能够快速从全世界这么多语料中找到你想要的句子,这个神器主要靠的是一个超大的数据集和一个推荐模型。数据集包含了英语、现代汉语和文言文三大部分。
其中,英语部分有 6108 个名言警句和 126713 个上下文文本段;现代汉语部分,包含有 3004 句名言和 408433 个相关上下文;文言文部分,则有 4438 段文言典故(包括古诗)和 116537 段相关上下文。
推荐模型方面,本文提出使用 BERT 作为句子编码器来学习名言警句和相关文本表示。
但由于绝大多数名言警句的表达都非常凝练,但是可能其中每个背后的意义又包含很多层,所以在本方法中,研究人员将义原引入到编码器中。
简单来说,义原是语言学中最小的语义单位。语言学家认为义原体系在任何语言中都适用,不与特定语言相关。
举个例子,“男孩”这个词可以由“人类”、“男性”、“儿童”这个三个义原表示,“女孩”则可以由“人类”、“女性”、“儿童”的组合来表达。
因此在模型中引入义原后,就能很好解决词义消歧的问题,并且能更准确地捕捉到词与词之间的关系。也就是让模型把语言学得更加透彻。而在具体任务对比中可以看到,本文方法的性能均优于其他方法。同时用消融实验验证了训练方法的有效性(下表最后三行结果)。
在只给出左侧文本的条件下,本文方法的结果依旧优于过去方法。
还有反向词典和 AI 作诗系统
看到这里你可能觉得这项工作有点似曾相识。没错,那个之前爆火的“反向词典”也来自这个实验室。所谓“反向”,就是和常规词典不同,不是按词寻义,而是反过来给词典一段描述,让它来帮你找词。
比如还是这句“听我说谢谢你,因为有你,温暖了四季”,用成语应该怎么说?
反向词典可以立马抛出几十乃至上百个选项出来,并且还会标注推荐程度。背景颜色越深,代表系统推荐程度越高。
要是碰上啥看不懂的,鼠标一点,就能查看具体释义。
而除了拯救现代失语人外,他们还让 AI 尝试过写古诗,之前也在网络上爆火过。
不得不说,THUNLP 真是要把 AI + 中文玩出花了。
该实验室由孙茂松教授领衔,教师队伍中还有刘洋教授和刘知远副教授。
前不久,THUNLP 还获得了 ACL 2022 最佳演示论文奖(Best Demo Paper Award)。
该奖项是 ACL 系列会议对 System Demonstration 论文授予的最佳论文奖项,每届会议基于评审人员评估的系统贡献度、完成度、影响力及会议演示综合效果的综合评价评选出一篇获奖论文。
One More Thing
目前,“反向词典”在网页端和微信小程序上都能使用,App 在路上了。“据意查句”还只能在网页端使用(需要扫码关注公众号登录一下子)。
另外,团队表示还是希望大家在使用时多给反馈、多提建议。比如给好的推荐名句点赞,如果看到有错误之处也能直接指正。
对了,研发团队还表示,作为开源项目随时欢迎大家加入,参与项目设计 & 开发、提出需求、反馈问题。
感兴趣的话就去官网戳戳公告吧~
“据意查句”官网:
https://wantquotes.net/
“反向词典”官网:
https://wantwords.net/
参考链接:
https://weibo.com/5198011111/LE58vxn0N?

微信公众号
很赞哦!(0)
相关文章
文章评论
评论0
站点信息
- 微信公众号:扫描二维码,关注我们

点击排行

标签云
-
php
网页设计
个人博客
JS
个人博客
Html
春节必看: 2020新春红包大战 全攻略
新增详细玩法攻略!
支付宝集五福5亿集分宝招商银行抽现金券抖
抖音 2020 发财中国年 攻略
支付宝集五福5亿集分宝招商银行抽现金券抖
最近购买威尔胜WTB0900复刻版和WT
mysql慢查询和php-fpm慢日志
PSR-2
基础代码规范
Thinkphp
响应式
公司
整站
源码
网络科技网站模板
1024
节日
百度收录
论坛
社区
2020
豆瓣
评分最高
电影
debugger
调试
Python
语法
高德
百度地图
MySQL
追寻
webpack
vue
oracle
服务器搭建
有趣
动物
人体
历史
天文
生活
名人
体育
地理
文化
科学
心理
植物
饮食
自然
图片
JVM
IDEA
Loader
Git
UNIAPP
股票
A股
同花顺
海尔
海天味业
半年报
股市总结
歌尔股份
乐普医疗
涪陵榨菜
餐饮
财报分析
酒店
年报分析
美锦能源
山煤国际
贵州茅台
张坤
腾讯
华鲁恒升
淮北矿业
药明康德
早盘关注
国电电力
北方华创
宝丰能源
TCL中环
兔宝宝
天润乳业
启明星辰
阳光电源
山西汾酒
迈瑞医疗
人福医药
比亚迪
宁德时代
汤臣倍健
伊利股份
通威股份
东鹏饮料
隆基股份
紫金矿业
五粮液
康龙化成
赣锋锂业
爱尔眼科
片仔癀
VR
永新股份
爱美客
美的集团
格力电器
科沃斯
云南白药
同仁堂
洋河股份
白云山
三体
狂飙 原著