目录
- 医疗实体识别、关系抽取标注工具
- 标注思路
- BRAT
-
- 参考文档
- Brat docker image
- 其他
- error
医疗实体识别、关系抽取标注工具
-
哈工大开源标注工具
这个项目中不仅提供了用于命名实体识别和关系抽取的医疗数据标注工具,还提供了标注规范文档和可用于测试标注工具的部分电子病历样例。
https://github.com/WILAB-HIT/Resources -
BRAT
官网:http://brat.nlplab.org/index.html
安装包:https://github.com/nlplab/brat/releases/tag/v1.3_Crunchy_Frog
可视化效果很好,配置也比较方便,感觉可以用brat来标注,用哈工大的标注规范作为咱们制定标注规范的参考。brat需要在linux系统安装,我用vmware装了虚拟机,在ubuntu中简单试用了一下,效果如下
标注思路
医疗知识图谱相关的讲座,数研院介绍了他们标注实体和实体关系时,采用的预标注+人工校对的思路,感觉对提高标注效率还挺有帮助的。
https://mp.weixin.qq.com/s/gDMCfHP1xN7erjxvA-NZSw
BRAT
参考文档
Brat标注工具(本地)安装及使用【包含demo】
https://blog.csdn.net/p_jinsan/article/details/96152078
Brat文本注释工具的使用文档
介绍了事件抽取的标注方法
https://blog.csdn.net/Jay_Josby/article/details/103569721
Brat标注系统说明
介绍了快捷键
http://ws.nju.edu.cn/blog/2018/06/brat%E6%A0%87%E6%B3%A8%E7%B3%BB%E7%BB%9F%E8%AF%B4%E6%98%8E/
BRAT的安装、配置、标注操作
整体内容写的很详细。其中介绍了标注属性的相关内容。
https://blog.csdn.net/weixin_42927998/article/details/106623370
Brat docker image
-
https://hub.docker.com/r/heliex/docker-brat
这个挺好用,不过作者把镜像取消了分享。我导出了作者之前上传的镜像,镜像下载链接如下:
链接:https://pan.baidu.com/s/11Z5LwtLowwb10xq1gomSSQ
提取码:fcp5
镜像用法:
docker run -p 8080:80 -v /d/xx/brat-v1.3_Crunchy_Frog/data_docker/:/var/www/brat/data/annotatordata -d heliex/docker-brat
将上述命令中“/d/xx/brat-v1.3_Crunchy_Frog/data_docker/”换为本地存放data的地址就好。
brat config文件和data放在同一个文件夹即可生效。 -
https://hub.docker.com/r/cassj/brat
这个没试过
其他
-
HTML颜色代码
https://htmlcolorcodes.com/zh/ -
添加用户
直接在config.py文件中添加
USER_PASSWORD = {
‘admn’: ‘admin’,
‘test’: ‘test’,
}
error
python序列标注平台brat,文件换行为CRLF(\r\n)导致的bug记录
https://zhuanlan.zhihu.com/p/119316158