大嘴怪的小世界

使用keras进行二分类时，常使用binary_crossentropy作为损失函数。那么它的原理是什么，跟categorical_crossentropy、sparse_categorical_crossentropy有什么区别？在进行文本分类时，如何选择损失函数，有哪些优化损失函数的方式？本文将从原理到实现进行一一介绍。

阅读全文...

论文阅读：《Reformer: The Efficient Transformer》

2020-03-10

本论文为谷歌近期发表的对Transformer改进的一篇论文，论文名字中的Efficient Transformer解释了论文的主要目的。过去一些基于Transformer结构的论文，一看到模型的总参数量就让人望而生畏，有些模型在我们的单卡GPU上根本跑不起来，因此就看了一下这篇论文。论文感觉比较偏工程，了解下它的大致思想就好。

阅读全文...

PLY教程及例子

2020-03-03

最近需要重改语音助手中的计算器模块，打算用yacc&lex实现，在这里记录一下学习和使用过程。

阅读全文...

Spark入门

2020-02-26

最近需要用spark比较多，重新学习一下。今天先学习一些基础。

阅读全文...

一首小诗：做最好的自己

2020-02-16

今天看一个纪录片《人生第一次》时听到的小诗，来自美国诗人、短片小说作家——道格拉斯·马拉赫。

阅读全文...

机器翻译检测

2020-02-13

因为本周要做一个机器翻译检测的任务，因此搜到了几篇论文，看一下大概有哪些思路。论文基本上只简单扫了一眼，简单介绍一下其中的3篇。

阅读全文...