众生和万物啊.你们有没有兴趣一起参与一个,比起做黄油,和穿女装,更有意义的项目?
没错!
就是
github.com/pokemonchw/Dirty
这个项目
中文互联网环境实在太糟糕了
2019年比起2009年,十年,简直毫无进步
为了净化这个肮脏的世界
有了这个repo
这个repo最后的成果将会向所有人开放
用于识别一段文本是否是脏话
比起那些落后的识别方案,请相信我们的炼丹技术
唯一欠缺的,就是语料数据
感谢国家的净网行动
可以用来训练的脏话实在太少了......
所以,只好建立了这个repo
欢迎大家在这里随意的宣泄自己的情绪,没有人会指责你的,甚至,我们还得感谢你呢

虽然平时老在安利"好耶是女装",不过这次不是坑人的......这个项目是用来收集尽可能足够多的脏话数据,然后训练脏话识别模型......

Follow

@BonjourTotoro 新加坡这方面倒也挺先进的 zaobao.com.sg/news/singapore/s

不过这种东西一定会有误伤,然后被滥用,甚至可以被定向利用。对攻击模型这种事情的意识度还是不够,希望以后可以成为像用数据库必须知道注入一样的常识。

@ghost 这边的方案是识别脏话以后会给管理员推送,现在主要是卡在识别脏话这一环节,能够找到的脏话语料太少了.......

Sign in to participate in the conversation
Fairground

The social network of the future: No ads, no corporate surveillance, ethical design, and decentralization! Own your data with Mastodon!