王磊的博客

凡所有相,皆是虚妄

  • Home
  • About
  • github

seq2seq Pointer-Network Copy 等技术梳理

Posted on 2020-06-03

之前或多或少都有去关注以及该方面的paper阅读,但是并没有去好好的整理该技术的整体发展,今天闲来无事,想从代码以及paper的核心思想梳理一遍。供自己后续方便查看吧。

Pointer Networks

Read more »

git简单使用记录

Posted on 2020-05-28

创建版本库

mkdir learngit

cd learngit

pwd

git init 通过git init命令把这个目录变成Git可以管理的仓库

git add readme.txt 用命令git add告诉Git,把文件添加到仓库

git commit -m “wrote a readme file” 用命令git commit告诉Git,把文件提交到仓库

Read more »

lintcode 刷题(中等题)

Posted on 2020-04-14

统计数字

Read more »

lintcode 刷题

Posted on 2020-04-01

简单题

A + B 问题

给出两个整数,求和(用位运算)

Read more »

论文复现(一)

Posted on 2019-10-10

论文复现

类NER的方式从商品title中抽取需要的属性值,该论文采用了单BIO标签,所有属性都采用这一种标签模式,避免了随着属性值多的情况,标签数量剧增的情况
github代码

Read more »

Bert XLNet RoBerta ALBert

Posted on 2019-10-10

Bert

自编码语言模型。mask语言模型, next sentence mask预训练和finetune两阶段不一致,mask之间相互独立

Read more »

unittest单元测试

Posted on 2019-09-02

为什么需要单元测试

转载该博客,记录主要是自己日后查看

  1. 单元测试有没有必要?为什么需要单元测试?…… 理由简直多到不要不要的。总而言之,单元测试肯定是需要的。
  2. 对于算法工程师需要有单元测试吗?答案是:需要
  3. 最近老大要求我去对我负责的某个算法模块给出详细的单元报告,所以就写了一下这个报告
Read more »

Prometheus监控告警

Posted on 2019-09-02

算法部门接入Prometheus,自定义报警监控步骤

本文档不解释相关API的使用,自行查询

总体分3个步骤

  1. 在自己的服务模型中写入需要监控的代码,代码部署,运行起来,可以在监控页面搜索到自己的服务,可以看到你自己监控的一些数据,说明代码这一步就成功啦
  2. 配合Grafana跳转到图表显示面,进行配置。首先需要登陆,然后右上角会有一个add panel按钮,增加视图。
    点击add panel ,然后在刚创建的 New Panel 中选择 Choose Visualization 按钮,默认是Graph,接着点击左侧的Queries,在查询输入框中填入要查询的 metric, 创建即可完成
  3. 接入Alert报警配置
Read more »

Wikipedia构造平行语料

Posted on 2019-08-28

参考论文 Learning To Split and Rephrase From Wikipedia Edit History

Read more »

Cython与Spacy加速NLP项目

Posted on 2019-08-28

Cython与Spacy合用加速NLP项目

本次报告主要内容参考这篇博客,重点在spacy与自定义数据结构的分析

主要内容

  • 如何用 Python 设计一个高速模块
  • 如何利用 spaCy 的内部数据结构来有效地设计超高速 NLP 函数。
    Read more »
123

王磊

浙江理工大学19级,就职于杭州艾耕科技,从事NLP相关工作。

24 posts
49 tags
© 2021 王磊
Powered by Hexo
|
Theme — NexT.Mist v5.1.4