论文复现(一)

论文复现

类NER的方式从商品title中抽取需要的属性值,该论文采用了单BIO标签,所有属性都采用这一种标签模式,避免了随着属性值多的情况,标签数量剧增的情况
github代码

Scaling up Open Tagging from Tens to Thousands: Comprehension Empowered Attribute Value Extraction from Product Title

该论文是在OpenTag: Open Attribute Value Extraction from Product Profiles的基础上做的改进。模型结构如下:

从这个模型架构上来看,实现并不复杂,将title和attribute分别分词经过embedding后输入双向LSTM,title端经过LSTM后拿的是所有时间上的hidden,attribute经过lstm后只拿last hidden,之后两者做一个cos相似度计算,得到的矩阵和title经过lstm后的cat起来,输入到CRF层进行序列标注就OK了,具体实现看代码吧。