最新要闻
- 环球微资讯!一群环保人士 为何想限制游戏发展?
- 热资讯!首发199元 荣耀手环7发布:1.47英寸大屏 支持全天候血氧监测
- 韩国人造肉需求激增:近一半韩国年轻人买过吃过人造肉
- 02年小伙3年打6份工买车 正能量感染网友:送过外卖、做过服务员等
- 首发5680元 汉王N10 Max墨水平板发布:13.3英寸大屏
- 微头条丨失业率最高的西班牙:开始薅中国羊毛
- 环球观察:快2023年了还有友商拿8+128卡位凑数 一加11直接12G起步:欢迎友商跟进
- 天天新消息丨纯可可脂 怡浓55%-100%黑巧克力35元起
- N多玩家插反PS5游戏盘!官方发文纠正
- 环球聚焦:功耗高、死机!AMD正在拼命优化RX 7900驱动
- 男子自曝无聊送外卖结果2小时挣150 网友质疑摆拍:根本没地方停车
- C919起飞验证!波音、中国商飞新合作:开发全新飞机材料
- 全球热点!20000转风扇看得见!红魔8 Pro+氘锋透明版图赏
- 全球头条:想堵车都难 福特车路协同系统落地国内六城
- 当前动态:双旦狂欢价:腾讯视频/优酷视频会员5折起
- 官宣油耗3.8L 实际7L以上!吉利帝豪L雷神Hi·P混动遭出租车司机集体维权
手机
iphone11大小尺寸是多少?苹果iPhone11和iPhone13的区别是什么?
警方通报辅警执法直播中被撞飞:犯罪嫌疑人已投案
- iphone11大小尺寸是多少?苹果iPhone11和iPhone13的区别是什么?
- 警方通报辅警执法直播中被撞飞:犯罪嫌疑人已投案
- 男子被关545天申国赔:获赔18万多 驳回精神抚慰金
- 3天内26名本土感染者,辽宁确诊人数已超安徽
- 广西柳州一男子因纠纷杀害三人后自首
- 洱海坠机4名机组人员被批准为烈士 数千干部群众悼念
家电
天天热资讯!虚假新闻检测(MAC)《Hierarchical Multi-head Attentive Network for Evidence-aware Fake News Detection》
论文信息
论文标题:Hierarchical Multi-head Attentive Network for Evidence-aware Fake News Detection论文作者:Nguyen Vo, Kyumin Lee论文来源:2021EACL论文地址:download论文代码:download
1 Introduction
现有的基于证据的虚假新闻检测要么关注与词级注意力,要么关注于证据级的注意力,这将导致一个次优的结果。本文提出了一个联合结合了多头词级注意和多头文档级注意,这有助于词级和证据级的解释。
(资料图)
贡献:
- 提出了一种新的层次多头注意网络,将词注意和证据注意联合用于证据感知假新闻检测;
- 提出了一种新的多头注意机制来捕捉重要的单词和证据;
2 Problem Statement
We denote an evidence-based fact-checking dataset $\mathcal{C}$ as a collection of tuples $(c, s, \mathcal{D}, \mathcal{P})$ where $c$ is a textual claim originated from a speaker $s$, $\mathcal{D}= \left\{d_{i}\right\}_{i=1}^{k}$ is a collection of $k$ documents relevant to the claim $c$ and $\mathcal{P}=\left\{p_{i}\right\}_{i=1}^{k}$ is the corresponding publishers of documents in $\mathcal{D}$ . Note, $|\mathcal{D}|=|\mathcal{P}|$ . Our goal is to classify each tuple $(c, s, \mathcal{D}, \mathcal{P})$ into a pre-defined class (i.e. true news/fake news).
3Framework
框架: (1) embedding layer, (2)multi-head word attention layer, (3) multi-head document attention layer and (4) output layer.3.1 Embedding Layer
Each claim $c$ is modeled as a sequence of $n$ words $\left[w_{1}^{c}, w_{2}^{c}, \ldots, w_{n}^{c}\right]$ and $d_{i}$ is viewed as another sequence of $m$ words $\left[w_{1}^{d}, w_{2}^{d}, \ldots, w_{m}^{d}\right]$ . Each word $w_{i}^{c}$ and $w_{j}^{d}$ will be projected into D-dimensional vectors $\mathbf{e}_{i}^{c}$ and $\mathbf{e}_{j}^{d}$ respectively by an embedding matrix $\mathbf{W}_{e} \in \mathbb{R}^{V \times D}$ where $V$ is the vocabulary size. Each speaker $s$ and publisher $p_{i}$ modeled as one-hot vectors are transformed into dense vectors $\mathbf{s} \in \mathbb{R}^{D_{1}}$ and $\mathbf{p}_{i} \in \mathbb{R}^{D_{2}}$ respectively by using two matrices $\mathbf{W}_{s} \in \mathbb{R}^{S \times D_{1}}$ and $\mathbf{W}_{p} \in \mathbb{R}^{P \times D_{2}}$ , where $S$ and $P$ are the number of speakers and publishers in a training set respectively. Both $\mathbf{W}_{s}$ and $\mathbf{W}_{p}$ are uniformly initialized in $[-0.2,0.2]$ . Note that, both matrices $\mathbf{W}_{s}$ and $\mathbf{W}_{p}$ are jointly learned with other parameters of our MAC.3.2 Multi-head Word Attention Layer
将 claim 的词嵌入 $\mathbf{e}_{i}^{c}$ 送入 BiLSTM,生成文本表示 $\mathbf{h}_{i}^{c}=\left[\overleftarrow{\mathbf{h}_{i}} ; \overrightarrow{\mathbf{h}_{i}}\right] \in \mathbb{R}^{2 H}$,将生成的文本表示做平均池化 : $\mathbf{c}=\frac{1}{n} \sum\limits _{i=1}^{n} \mathbf{h}_{i}^{c} \quad\quad(1)$对 Evidence 使用 BiLSTM,得到 $\mathbf{h}_{j}^{d} \in \mathbb{R}^{2 H}$,将其词嵌入表示为 矩阵形式 $\mathbf{H}=\left[\mathbf{h}_{1}^{d} \oplus \mathbf{h}_{2}^{d} \oplus \ldots \oplus \mathbf{h}_{m}^{d}\right] \in \mathbb{R}^{m \times 2 H}$。
为了理解文档中的信息帮助我们对 Claim 进行事实核查,我们需要指导我们的模型关注文档中的关键字或短语。我们首先复制向量 $c $ ($Eq.1$) $m$ 次创建矩阵 $\mathbf{C}_{1} \in \mathbb{R}^{m \times 2 H}$,并提出一种注意机制,具体如下:
$\mathbf{a}_{1}=\operatorname{softmax}\left(\tanh \left(\left[\mathbf{H} ; \mathbf{C}_{1}\right] \cdot \mathbf{W}_{1}\right) \cdot \mathbf{w}_{2}\right)\quad\quad(2)$
其中,$\mathbf{w}_{2} \in \mathbb{R}^{a_{1}}$,$\mathbf{W}_{1} \in \mathbb{R}^{4 H \times a_{1}}$,$\mathbf{a}_{1} \in \mathbb{R}^{m}$是在 $m$ 个单词上的注意力分布。
然而,文档的总体语义可能由文档的多个部分生成。因此,我们提出一个多头词注意机制,通过将向量 $w_2$ 扩展到矩阵 $\mathbf{W}_{2} \in \mathbb{R}^{a_{1} \times h_{1}}$ 来捕获不同的语义贡献,其中 $h_1$ 为 Figure 1 所示的注意头数。修改 $\text{Eq.2}$ 具体内容如下:
$\mathbf{A}_{1}=\operatorname{softmax}_{c o l}\left(\tanh \left(\left[\mathbf{H} ; \mathbf{C}_{1}\right] \cdot \mathbf{W}_{1}\right) \cdot \mathbf{W}_{2}\right)\quad\quad(3)$其中,$\mathbf{A}_{1} \in \mathbb{R}^{m \times h_{1}}$,$\mathbf{A}_{1}$ 代表在文档 $d_i$ 中的 $m$ 个单词之上的 $h_1$ 不同的注意力分布,帮助我们捕获文档的不同方面。
在计算了 $\mathbf{A}_{1}$ 后 ,我们推导出文档 $d_i$ 的表示方式如下:
$\mathbf{d}_{i}=\operatorname{flatten}\left(\mathbf{A}_{1}^{T} \cdot \mathbf{H}\right)\quad\quad(4)$
其中,$\mathbf{d}_{i} \in \mathbb{R}^{h_{1} 2 H}$。
3.3Multi-head Document Attention Layer
Extending representations of claimsspearker 有的时候非常重要,因此将其考虑入 claim :
$\mathbf{c}^{e x t}=[\mathbf{c} ; \mathbf{s}] \in \mathbb{R}^{x} \quad\quad(5)$
其中,$x = 2 H+D_{1}$。
Extending representations of evidence同样publisher 对于 Evidence 的真实性也有很大的帮助,所以:
$\mathbf{d}_{i}^{e x t}=\left[\mathbf{d}_{i} ; \mathbf{p}_{i}\right] \in \mathbb{R}^{y}\quad\quad(6)$
其中,$y= 2 h_{1} H+D_{2}$。
从 $\text{Eq.6}$ 开始,我们可以生成 $k$ 个相关文章的表示,并堆栈,如 $\text{Eq.7}$ 所示:
$\mathbf{D}=\left[\mathbf{d}_{1}^{e x t} \oplus \ldots \oplus \mathbf{d}_{k}^{e x t}\right] \in \mathbb{R}^{k \times y}\quad\quad(7)$
3.4 Multi-head Document Attention Mechanism
即使选择了 $k$ 个最相关的文章来判别 claim $c$ 的真实性,但是实际上往往只有个别几篇文章被用于判断 claim $c$ 的真实性,所以本文再一次使用注意力机制来选择合适的 documnet。
首先通过将 $\mathbf{c}^{e x t}$ 复制 $k$ 次,得到 $\mathbf{C}_{2} \in \mathbb{R}^{k \times x}$,然后将其与 $D$ ($\text{Eq.7}$) 拼接得到 $\left[\mathbf{D} ; \mathbf{C}_{2}\right] \in \mathbb{R}^{k \times(x+y)}$。
我们提出的多头文档级注意机制应用了 $h_2$ 个不同的注意头,如 $\text{Eq.8}$ 所示:
$\mathbf{A}_{2}=\operatorname{softmax}_{c o l}\left(\tanh \left(\left[\mathbf{D} ; \mathbf{C}_{2}\right] \cdot \mathbf{W}_{3}\right) \cdot \mathbf{W}_{4}\right)$
其中,$\mathbf{W}_{3} \in \mathbb{R}^{(x+y) \times a_{2}}$、$\mathbf{W}_{4} \in \mathbb{R}^{a_{2} \times h_{2}}$、$\mathbf{A}_{2} \in \mathbb{R}^{k \times h_{2}}$ 。
使用注意权重,我们可以生成 $k$ 个证据的参与表示,表示为 $\mathbf{d}^{r i c h} \in \mathbb{R}^{h_{2} y}$,如 $\text{Eq.9}$ 所示:
$\mathbf{d}^{\text {rich }}=\operatorname{flatten}\left(\mathbf{A}_{2}^{T} \cdot \mathbf{D}\right)\quad\quad(9)$
3.5 Output Layer
将 $\left[\mathbf{c}^{e x t} ; \mathbf{d}^{\text {rich }}\right]$ 作为 MLP 的输入,计算 claim 真实性的概率:
$\hat{y}=\sigma\left(\mathbf{W}_{6} \cdot\left(\mathbf{W}_{5} \cdot\left[\mathbf{c}^{\text {ext }} ; \mathbf{d}^{\text {rich }}\right]+\mathbf{b}_{5}\right)+\mathbf{b}_{6}\right)\quad\quad(10)$
采用交叉熵优化模型:
$\mathcal{L}_{\theta}(y, \hat{y})=-(y \log \hat{y}+(1-y) \log (1-\hat{y}))\quad\quad(11)$
4 Experiment
DatasetsNote:Each Snopes claim was labeled as true or false while in Politifact, there were originally six labels: true, mostly true, half true, false, mostly false, pants on fire. Following (Popat et al., 2018), we merge true, mostly true and half true into true claims and the rest are into false claims.
BaselinesUsing only claims’ text:
- BERT
- LSTM-Last
- LSTM-Avg
- CNN
- DeClare
- HAN
- NSMN
Performance of MAC and baselines
-
天天热资讯!虚假新闻检测(MAC)《Hierarchical Multi-head Attentive Network for Evidence-aware F
论文信息论文标题:HierarchicalMulti-headAttentiveNetworkforEvidence-awareFakeNewsDetection论文作者:Nguye
来源: -
天天讯息:Atcoder Beginner Contest ABC 283 Ex Popcount Sum 题解 (类欧几里得算法)
题目链接令$p= lfloor frac{n-r}m rfloor$,则我们其实是要对所有$0 lei le29$求$ sum_{j=0}^p( lfloor frac{mj+r}{2^i
来源: 天天热资讯!虚假新闻检测(MAC)《Hierarchical Multi-head Attentive Network for Evidence-aware F
天天讯息:Atcoder Beginner Contest ABC 283 Ex Popcount Sum 题解 (类欧几里得算法)
环球微资讯!一群环保人士 为何想限制游戏发展?
热资讯!首发199元 荣耀手环7发布:1.47英寸大屏 支持全天候血氧监测
韩国人造肉需求激增:近一半韩国年轻人买过吃过人造肉
02年小伙3年打6份工买车 正能量感染网友:送过外卖、做过服务员等
首发5680元 汉王N10 Max墨水平板发布:13.3英寸大屏
微头条丨失业率最高的西班牙:开始薅中国羊毛
短讯!JMeter
第四章 --------------------XAML名称空间
环球观察:快2023年了还有友商拿8+128卡位凑数 一加11直接12G起步:欢迎友商跟进
天天新消息丨纯可可脂 怡浓55%-100%黑巧克力35元起
N多玩家插反PS5游戏盘!官方发文纠正
环球聚焦:功耗高、死机!AMD正在拼命优化RX 7900驱动
男子自曝无聊送外卖结果2小时挣150 网友质疑摆拍:根本没地方停车
天天消息!AcWing. 1146 新的开始
C919起飞验证!波音、中国商飞新合作:开发全新飞机材料
全球热点!20000转风扇看得见!红魔8 Pro+氘锋透明版图赏
全球头条:想堵车都难 福特车路协同系统落地国内六城
记录--vue.config.js 的完整配置(超详细)!
当前动态:双旦狂欢价:腾讯视频/优酷视频会员5折起
官宣油耗3.8L 实际7L以上!吉利帝豪L雷神Hi·P混动遭出租车司机集体维权
超越索尼PS4!任天堂Switch全球销量达1.18亿台:史上销量第四主机
环球观热点:东航C919今日起验证飞行:持续至2月中旬 商业载客不远了
全球观察:钱不好赚了?苹果今年第四季度净利或下降8%以上
Kubernetes监控手册04-监控Kube-Proxy
天天微头条丨Zabbix技术分享——snmp异常排查指南
对不起,你做的 A/B 实验都是错的——火山引擎 DataTester 科普
当前消息!与时代共命运:数智时代的到来意味着什么?
AcWing1144. 连接格点
每日快看:攀升年底大促!16GB轻薄本仅1698元
【天天报资讯】拆分数据库变相涨价!知网滥用市场支配地位被罚8760万元
焦点播报:神了!1919年一幅漫画预言了手机 这六个场景太真实
今日最新!蚊子变疫苗:中科院新研究可以从源头抑制新发传染病
视点!网友青岛莱西湖附近偶遇老虎 官方回应:已捉回、未造成伤害
全球速递!项目播报 | 方正璞华×连森电子,打造电子材料行业PLM系统的新标杆!
今日快看!Python爬虫学习:Cookie 和 Session 的区别是什么?
环球短讯!Python模块学习,模块是,什么
全球观速讯丨飞项三招教你用协同工具杜绝远程办公“摸鱼”
XYplorer使用教程
李斌再度回应蔚来数据泄露 公司赔破产也不会妥协
【天天新视野】7.4GB/s速度 忆联发布数据中心级SSD:ES.3版容量超15TB
你期待谁?兔年春晚首次大联排引围观 沈腾马丽等明星现身:网友兴奋
奥运冠军还是学霸!谷爱凌晒斯坦福大学首份成绩单:全科满分
每日精选:续航200km有快充 吉利熊猫mini新春版官图发布:妹子最爱
【播资讯】Jaeger&ElasticSearch存储链路追踪数据
环球聚焦:开源漏洞数量增长33%!企业安全债务不堪重负丨行业数据
重拾低价策略!京东善做PPT、说假大空话的高管被刘强东拿下:就是骗子
“史诗级”暴风雪吹乱北美圣诞:40年最冷!节日档期票房泡汤
当前快报:频放生、卖鳄雀鳝!违法放生、丢弃外来入侵物种将被严惩 网友赞
全球简讯:云南女子取快递发现包裹长菌子:感觉很神奇
著名动画艺术家严定宪去世 作品有《大闹天宫》《哪吒闹海》等
天天百事通!【年终总结】求职面试一定要扬长避短
没sei了!父亲哄4岁女儿签20年不交男友合约 网友乐翻
智己汽车:一手好牌打得稀烂
全球看热讯:AcWing244.谜一样的牛
6旬大爷花40年收藏670辆老爷车:耗资4亿元 最爱这品牌
环球视点!美国肯尼迪国际机场一客机发生火情:致5人受伤
天天视讯!男子喂海鸥 头发被当成鸟窝不停被啄
新资讯:接到推销电话后男子“神操作”获赔500元 网友:学到了
环球焦点!真心刹不住 实拍火车撞上货车:动能太强、瞬间脱轨
349元 小米推出首款米家智能鱼缸:半年免换水、支持远程投食
世界快资讯丨欧洲电价有多离谱?开电车比开油车还要贵 对比国内差距大
天天新资讯:广州热门景区重现“人山人海”:订票量猛增
环球今热点:Redmi K60 Pro官宣搭载小米影像大脑2.0:小米迄今最好的影像技术
专家狠批算法推荐:看短视频频率影响未成年人价值取向 毒害太大
新世界铁林是好人还是坏人?新世界铁林的结局是什么?
盲目从众是什么意思?盲目从众的危害有哪些?
江西四大摇篮是什么意思?江西四大摇篮分别是哪里?
明治维新的性质是什么?明治维新的性质和影响是什么?
天天新动态:AcWing291.蒙德里安的梦想题解
世界热推荐:从零演示如何基于 IDL 方式来定义 Dubbo 服务并使用 Triple 协议
全球动态:springboot 连接不上 redis 的三种解决方案!
瑰石装备可以账号共享吗?瑰石的功效与作用是什么?
古代后宫妃子怎么称呼?古代后宫妃子等级排序
过春节的国家有哪些?和我国同一天过春节的国家有哪些?
比特率是什么意思?比特率一般设置多少才算最好?
长篇小说一般多少字?2022年长篇小说排行榜前十名
付款方式无效怎么解决?付款方式有哪些?
冰箱冷藏室多少温度合适?冰箱冷藏室有水是怎么回事?
洗衣机不脱水了是怎么回事?洗衣机不脱水怎么解决?
淘宝换货流程怎么操作?淘宝换货流程注意事项有哪些?
空调模式有哪几种?空调模式三个水滴是什么意思?
ifox是什么格式的文件?ifox文件格式怎么打开?
每日看点!班尼路双旦大促:羽绒/棉服99元、牛仔/加绒裤49元起清仓
满血性能铁三角!一加11搭载LPDDR5X+UFS 4.0:直接12GB内存起步
热点评!株洲国际赛车场现卡丁车严重事故:车手被曝已身亡
K系列最强影像系统!Redmi K60 Pro搭载IMX800旗舰传感器
环球简讯:女子醉驾被查现场狂飙演技:我心脏不好、为什么如此对我
【脚本项目源码】Python制作提升成功率90%的表白神器
刘强东:没离开过
百公里最多节油1升 五菱推出超级省油模式:星辰混动率先用上
环球热消息:GS5还是PS5?国外网友晒奇葩“山寨”商品
环球热头条丨当大厂程序员已开始用AI写代码 人类会被AIGC淘汰吗?
【环球新视野】2023年旗舰焊门员!Redmi K60 Pro卖2999不可能了
《阿凡达:水之道》全球票房破8亿美元:口碑仍下滑 20亿美元才能回本
【播资讯】5.3分口碑扑街的好莱坞大烂片《真人快打》:要拍续集了
今日报丨库存严重还是别的?特斯拉上海工厂被曝已停产 官方正式回应不完全准确
【全球时快讯】比燃油车更污染!丰田CEO吐槽新能源车愚蠢后:用户最想要的是混动
天天观点:Epic喜加一!《死亡搁浅》免费送:立省88元