请问,char_level=True参数的具体含义是什么?

char_level大部分情况下都可以是True吗?跟训练数据是按单字标记和词标记没有关系吗?

ner.fit(
DATASETS_TRAIN,
DATASETS_TEST,
save_dir,
# ‘bert-base-chinese’,
‘D:\NLP\hanlp\bert-base-chinese’,
max_seq_len=300,
char_level=True,
hard_constraint=True,
sampler_builder=SortingSamplerBuilder(batch_size=64),
epochs=30,
adam_epsilon=1e-6,
warmup_steps=0.1,
weight_decay=0.01,
word_dropout=0.1,
seed=1609836303,
batch_size=64,
# token_key=token_key,
devices=0
)

在 O
中 B-NT
国 M-NT
致 M-NT
公 M-NT
党 M-NT
第 M-NT
十 M-NT
一 M-NT
次 M-NT
全 M-NT
国 M-NT
代 M-NT
表 M-NT
大 M-NT
会 E-NT
隆 O
重 O
召 O
开 O
之 O
际 O

珠海 B-ORGANIZATION
格力 M-ORGANIZATION
公司 E-ORGANIZATION
董明珠 S-PERSON
副 O
总经理 O
一 O
提起 O
评比 O

1 Like

https://hanlp.hankcs.com/docs/api/hanlp/components/ner/transformer_ner.html#hanlp.components.ner.transformer_ner.TransformerNamedEntityRecognizer.fit