命名实体识别(NER)标注方法BIO,BMES和BIOES

shizidushu 算法识读 / 2024-10-12 / 原文

命名实体识别(NER)标注方法BIO,BMES和BIOES

说明:

  • 首次发表日期:2024-10-11
  • 参考资料:
    • https://juejin.cn/post/7011722717242064932
    • https://www.modb.pro/db/472583
    • https://www.modb.pro/db/496190
    • https://www.researchgate.net/publication/257875124_Recognizing_clinical_entities_in_hospital_discharge_summaries_using_Structural_Support_Vector_Machines_with_word_representation_features

BIO/IOB

  • B: beginning of an entity. 实体的开头。
  • I: inside an entity. 实体的中间。
  • O: outside of an entity. 不属于实体。

样例:

本 O
报 O
北 B-LOC
京 I-LOC
9 O
月 O
4 O
日 O
讯 O
记 O
者 O
杨 B-PER
涌 I-PER
报 O
道 O

BIESO/BIOES/IOBES

  • B: beginning. 开始
  • I: intermediate/inside. 中间/内部
  • E: end.
  • S: single word entity.
  • O: outside.

样例:

change in mental status and increased respiratory distress
change B-problem
in I-problem
mental I-problem
status E-problem
and O
increased B-problem
respiratory I-problem
distress E-problem

BMES

  • B: beginning. 开头
  • M: middle. 中间
  • E: end. 结尾
  • S: single. 一个单独的字词

样例:

我 S
是 S
四 B
川 M
人 E