关于主题抽取中的代码 #4

acmilannesta · 2019-06-20T19:00:41Z

作者你好，我刚入门NLP。对于下面这几行代码不是很理解，想请问一下, 在extract_entity函数中，为何要将_ps递减10，谢谢！

if len(_t) == 1 and re.findall(u'[^\u4e00-\u9fa5a-zA-Z0-9\*]', _t) and _t not in additional_chars:           
    _ps1[i] -= 10

The text was updated successfully, but these errors were encountered:

bojone · 2019-06-29T05:45:30Z

防止抽取出的实体包含非法字符。

Hejp5665 · 2019-07-18T11:02:34Z

虽然我是菜鸟，但我觉得你的代码不够简洁

bojone · 2019-07-19T06:17:22Z

请教简洁写法

natureLanguageQing · 2019-07-23T09:38:04Z

能把苏老师逼成这样子的你也是厉害，主要是因为数据传输的过程中会有一定的数据丢失，或者是数据转存中的方法不统一，所以造成读取文件的时候会报错，针对数据集做一些优化这个必不可少

Provide feedback