jtyoui.word package¶
Submodules¶
jtyoui.word.NAA module¶
-
class
jtyoui.word.NAA.
NAA
(split_num=4, seq=0.001, cond=50, free=0.5)[源代码]¶ 基类:
object
-
all_lens
= 0.0¶
-
filter
(filter_cond=10, filter_free=0.5, flag=False)[源代码]¶ 过滤一些不重要的数据
[出现次数,出现频率,凝固程度,自由程度]
参数: - filter_cond – 过滤凝聚度
- filter_free – 过滤自由度
- flag – 是否是并且还是或者,默认是或者,满足一个就过滤
返回: 过滤后的数据字典
-
naa_words
= {}¶
-
jtyoui.word.TS module¶
jtyoui.word.ThreadNeologism module¶
-
class
jtyoui.word.ThreadNeologism.
Neologism
(q, split_num=4)[源代码]¶ -
-
run
()[源代码]¶ Method representing the thread’s activity.
You may override this method in a subclass. The standard run() method invokes the callable object passed to the object’s constructor as the target argument, if any, with sequential and keyword arguments taken from the args and kwargs arguments, respectively.
-
-
jtyoui.word.ThreadNeologism.
filter_words
(frequency, cond, free, flag)[源代码]¶ 过滤一些不重要的数据
[出现次数,出现频率,凝固程度,自由程度]
参数: - frequency – 过滤的频率
- cond – 过滤凝聚度
- free – 过滤自由度
- flag – 是否是并且还是或者,默认是或者,满足一个就过滤
返回: 过滤后的数据字典
-
jtyoui.word.ThreadNeologism.
handle
(key_list)[源代码]¶ 处理数据 计算左邻字集合和右邻字集合的频率,左邻字信息熵和右邻字信息熵中的较小值 计算凝固程度,自由程度
-
jtyoui.word.ThreadNeologism.
read_file
(file, file_encoding='utf-8')[源代码]¶ 读取文件内容,注意文件是UTF-8的格式且不是BOM格式
参数: - file – 读取的文件
- file_encoding – 文本编码
jtyoui.word.neologism module¶
-
class
jtyoui.word.neologism.
Neologism
[源代码]¶ 基类:
object
-
filter_words
(count, frequency, cond, free)[源代码]¶ 过滤一些不重要的数据
[出现次数,出现频率,凝固程度,自由程度]
参数: - count – key出现的次数
- frequency – 过滤的频率
- cond – 过滤凝聚度
- free – 过滤自由度
返回: 过滤后的数据字典
-