文章目录

  • 1 任务
  • 2.IMDB数据集下载探索
  • 3.THUCNews数据子集探索
      • 查看下训练集总共有多少种类别,以及各类别的数量
    • 数据预处理
    • 1.通过训练集数据,建立自己的字典
    • 2、读取字典的方法,供后续使用
  • 任务三
    • 机器学习中的分类指标
      • 精确率和召回率
        • 精确率(Precision)
        • 召回率(Recall)
        • F1分数
      • P-R曲线
      • ROC和AUC
        • ROC
        • AUC

1 任务

  1. 数据集
    数据集:中、英文数据集各一份

中文数据集:THUCNews
THUCNews数据子集:https://pan.baidu.com/s/1hugrfRu 密码:qfud
英文数据集:IMDB数据集 Sentiment Analysis

  1. IMDB数据集下载和探索

参考TensorFlow官方教程:影评文本分类 | TensorFlow
科赛 - Kesci.com

  1. THUCNews数据集下载和探索

参考博客中的数据集部分和预处理部分:CNN字符级中文文本分类-基于TensorFlow实现 - 一蓑烟雨 - CSDN博客
参考代码:text-classification-cnn-rnn/cnews_loader.py at mas…

  1. 学习召回率、准确率、ROC曲线、AUC、PR曲线这些基本概念

参考1:机器学习之类别不平衡问题 (2) —— ROC和PR曲线_慕课手记

2.IMDB数据集下载探索

#导入包
import tensorflow as tf
from tensorflow import kerasimport numpy as np
#导入iMBD数据集
imdb = keras.datasets.imdb
#探索数据集
(train_data, train_labels), (test_data, test_labels) = imdb.load_data(num_words=10000)
#分析数据集
help(imdb.load_data)
Help on function load_data in module tensorflow.python.keras.datasets.imdb:load_data(path='imdb.npz', num_words=None, skip_top=0, maxlen=None, seed=113, start_char=1, oov_char=2, index_from=3, **kwargs)Loads the IMDB dataset.Arguments:path: where to cache the data (relative to `~/.keras/dataset`).num_words: max number of words to include. Words are rankedby how often they occur (in the training set) and onlythe most frequent words are keptskip_top: skip the top N most frequently occurring words(which may not be informative).maxlen: sequences longer than this will be filtered out.seed: random seed for sample shuffling.start_char: The start of a sequence will be marked with this character.Set to 1 because 0 is usually the padding character.oov_char: words that were cut out because of the `num_words`or `skip_top` limit will be replaced with this character.index_from: index actual words with this index and higher.**kwargs: Used for backwards compatibility.Returns:Tuple of Numpy arrays: `(x_train, y_train), (x_test, y_test)`.Raises:ValueError: in case `maxlen` is so lowthat no input sequence could be kept.Note that the 'out of vocabulary' character is only used forwords that were present in the training set but are not includedbecause they're not making the `num_words` cut here.Words that were not seen in the training set but are in the test sethave simply been skipped.
print("Training shape: {}, labels: {}".format(train_data.shape, train_labels.shape))
Training shape: (25000,), labels: (25000,)
print(train_data[:5])
print(train_labels[:5])
[list([1, 14, 22, 16, 43, 530, 973, 1622, 1385, 65, 458, 4468, 66, 3941, 4, 173, 36, 256, 5, 25, 100, 43, 838, 112, 50, 670, 2, 9, 35, 480, 284, 5, 150, 4, 172, 112, 167, 2, 336, 385, 39, 4, 172, 4536, 1111, 17, 546, 38, 13, 447, 4, 192, 50, 16, 6, 147, 2025, 19, 14, 22, 4, 1920, 4613, 469, 4, 22, 71, 87, 12, 16, 43, 530, 38, 76, 15, 13, 1247, 4, 22, 17, 515, 17, 12, 16, 626, 18, 2, 5, 62, 386, 12, 8, 316, 8, 106, 5, 4, 2223, 5244, 16, 480, 66, 3785, 33, 4, 130, 12, 16, 38, 619, 5, 25, 124, 51, 36, 135, 48, 25, 1415, 33, 6, 22, 12, 215, 28, 77, 52, 5, 14, 407, 16, 82, 2, 8, 4, 107, 117, 5952, 15, 256, 4, 2, 7, 3766, 5, 723, 36, 71, 43, 530, 476, 26, 400, 317, 46, 7, 4, 2, 1029, 13, 104, 88, 4, 381, 15, 297, 98, 32, 2071, 56, 26, 141, 6, 194, 7486, 18, 4, 226, 22, 21, 134, 476, 26, 480, 5, 144, 30, 5535, 18, 51, 36, 28, 224, 92, 25, 104, 4, 226, 65, 16, 38, 1334, 88, 12, 16, 283, 5, 16, 4472, 113, 103, 32, 15, 16, 5345, 19, 178, 32])list([1, 194, 1153, 194, 8255, 78, 228, 5, 6, 1463, 4369, 5012, 134, 26, 4, 715, 8, 118, 1634, 14, 394, 20, 13, 119, 954, 189, 102, 5, 207, 110, 3103, 21, 14, 69, 188, 8, 30, 23, 7, 4, 249, 126, 93, 4, 114, 9, 2300, 1523, 5, 647, 4, 116, 9, 35, 8163, 4, 229, 9, 340, 1322, 4, 118, 9, 4, 130, 4901, 19, 4, 1002, 5, 89, 29, 952, 46, 37, 4, 455, 9, 45, 43, 38, 1543, 1905, 398, 4, 1649, 26, 6853, 5, 163, 11, 3215, 2, 4, 1153, 9, 194, 775, 7, 8255, 2, 349, 2637, 148, 605, 2, 8003, 15, 123, 125, 68, 2, 6853, 15, 349, 165, 4362, 98, 5, 4, 228, 9, 43, 2, 1157, 15, 299, 120, 5, 120, 174, 11, 220, 175, 136, 50, 9, 4373, 228, 8255, 5, 2, 656, 245, 2350, 5, 4, 9837, 131, 152, 491, 18, 2, 32, 7464, 1212, 14, 9, 6, 371, 78, 22, 625, 64, 1382, 9, 8, 168, 145, 23, 4, 1690, 15, 16, 4, 1355, 5, 28, 6, 52, 154, 462, 33, 89, 78, 285, 16, 145, 95])list([1, 14, 47, 8, 30, 31, 7, 4, 249, 108, 7, 4, 5974, 54, 61, 369, 13, 71, 149, 14, 22, 112, 4, 2401, 311, 12, 16, 3711, 33, 75, 43, 1829, 296, 4, 86, 320, 35, 534, 19, 263, 4821, 1301, 4, 1873, 33, 89, 78, 12, 66, 16, 4, 360, 7, 4, 58, 316, 334, 11, 4, 1716, 43, 645, 662, 8, 257, 85, 1200, 42, 1228, 2578, 83, 68, 3912, 15, 36, 165, 1539, 278, 36, 69, 2, 780, 8, 106, 14, 6905, 1338, 18, 6, 22, 12, 215, 28, 610, 40, 6, 87, 326, 23, 2300, 21, 23, 22, 12, 272, 40, 57, 31, 11, 4, 22, 47, 6, 2307, 51, 9, 170, 23, 595, 116, 595, 1352, 13, 191, 79, 638, 89, 2, 14, 9, 8, 106, 607, 624, 35, 534, 6, 227, 7, 129, 113])list([1, 4, 2, 2, 33, 2804, 4, 2040, 432, 111, 153, 103, 4, 1494, 13, 70, 131, 67, 11, 61, 2, 744, 35, 3715, 761, 61, 5766, 452, 9214, 4, 985, 7, 2, 59, 166, 4, 105, 216, 1239, 41, 1797, 9, 15, 7, 35, 744, 2413, 31, 8, 4, 687, 23, 4, 2, 7339, 6, 3693, 42, 38, 39, 121, 59, 456, 10, 10, 7, 265, 12, 575, 111, 153, 159, 59, 16, 1447, 21, 25, 586, 482, 39, 4, 96, 59, 716, 12, 4, 172, 65, 9, 579, 11, 6004, 4, 1615, 5, 2, 7, 5168, 17, 13, 7064, 12, 19, 6, 464, 31, 314, 11, 2, 6, 719, 605, 11, 8, 202, 27, 310, 4, 3772, 3501, 8, 2722, 58, 10, 10, 537, 2116, 180, 40, 14, 413, 173, 7, 263, 112, 37, 152, 377, 4, 537, 263, 846, 579, 178, 54, 75, 71, 476, 36, 413, 263, 2504, 182, 5, 17, 75, 2306, 922, 36, 279, 131, 2895, 17, 2867, 42, 17, 35, 921, 2, 192, 5, 1219, 3890, 19, 2, 217, 4122, 1710, 537, 2, 1236, 5, 736, 10, 10, 61, 403, 9, 2, 40, 61, 4494, 5, 27, 4494, 159, 90, 263, 2311, 4319, 309, 8, 178, 5, 82, 4319, 4, 65, 15, 9225, 145, 143, 5122, 12, 7039, 537, 746, 537, 537, 15, 7979, 4, 2, 594, 7, 5168, 94, 9096, 3987, 2, 11, 2, 4, 538, 7, 1795, 246, 2, 9, 2, 11, 635, 14, 9, 51, 408, 12, 94, 318, 1382, 12, 47, 6, 2683, 936, 5, 6307, 2, 19, 49, 7, 4, 1885, 2, 1118, 25, 80, 126, 842, 10, 10, 2, 2, 4726, 27, 4494, 11, 1550, 3633, 159, 27, 341, 29, 2733, 19, 4185, 173, 7, 90, 2, 8, 30, 11, 4, 1784, 86, 1117, 8, 3261, 46, 11, 2, 21, 29, 9, 2841, 23, 4, 1010, 2, 793, 6, 2, 1386, 1830, 10, 10, 246, 50, 9, 6, 2750, 1944, 746, 90, 29, 2, 8, 124, 4, 882, 4, 882, 496, 27, 2, 2213, 537, 121, 127, 1219, 130, 5, 29, 494, 8, 124, 4, 882, 496, 4, 341, 7, 27, 846, 10, 10, 29, 9, 1906, 8, 97, 6, 236, 2, 1311, 8, 4, 2, 7, 31, 7, 2, 91, 2, 3987, 70, 4, 882, 30, 579, 42, 9, 12, 32, 11, 537, 10, 10, 11, 14, 65, 44, 537, 75, 2, 1775, 3353, 2, 1846, 4, 2, 7, 154, 5, 4, 518, 53, 2, 2, 7, 3211, 882, 11, 399, 38, 75, 257, 3807, 19, 2, 17, 29, 456, 4, 65, 7, 27, 205, 113, 10, 10, 2, 4, 2, 2, 9, 242, 4, 91, 1202, 2, 5, 2070, 307, 22, 7, 5168, 126, 93, 40, 2, 13, 188, 1076, 3222, 19, 4, 2, 7, 2348, 537, 23, 53, 537, 21, 82, 40, 2, 13, 2, 14, 280, 13, 219, 4, 2, 431, 758, 859, 4, 953, 1052, 2, 7, 5991, 5, 94, 40, 25, 238, 60, 2, 4, 2, 804, 2, 7, 4, 9941, 132, 8, 67, 6, 22, 15, 9, 283, 8, 5168, 14, 31, 9, 242, 955, 48, 25, 279, 2, 23, 12, 1685, 195, 25, 238, 60, 796, 2, 4, 671, 7, 2804, 5, 4, 559, 154, 888, 7, 726, 50, 26, 49, 7008, 15, 566, 30, 579, 21, 64, 2574])list([1, 249, 1323, 7, 61, 113, 10, 10, 13, 1637, 14, 20, 56, 33, 2401, 18, 457, 88, 13, 2626, 1400, 45, 3171, 13, 70, 79, 49, 706, 919, 13, 16, 355, 340, 355, 1696, 96, 143, 4, 22, 32, 289, 7, 61, 369, 71, 2359, 5, 13, 16, 131, 2073, 249, 114, 249, 229, 249, 20, 13, 28, 126, 110, 13, 473, 8, 569, 61, 419, 56, 429, 6, 1513, 18, 35, 534, 95, 474, 570, 5, 25, 124, 138, 88, 12, 421, 1543, 52, 725, 6397, 61, 419, 11, 13, 1571, 15, 1543, 20, 11, 4, 2, 5, 296, 12, 3524, 5, 15, 421, 128, 74, 233, 334, 207, 126, 224, 12, 562, 298, 2167, 1272, 7, 2601, 5, 516, 988, 43, 8, 79, 120, 15, 595, 13, 784, 25, 3171, 18, 165, 170, 143, 19, 14, 5, 7224, 6, 226, 251, 7, 61, 113])]
[1 0 0 1 0]
#获取前两个文本长度
len(train_data[0]), len(train_data[1])
(218, 189)
#获取前三个类别
print(train_labels[:3])
[1 0 0]
#:
#获取字词-整数字典标签
word_index = imdb.get_word_index()
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/imdb_word_index.json
1646592/1641221 [==============================] - 0s 0us/step
# reverse_word_index反序字典格式:{序号:单词}
reverse_word_index=dict([(value, key) for (key, value) in word_index.items()])
# 查看前5个序号的单词,注意序号从1开始
for i in range(5):print(reverse_word_index[i+1])
the
and
a
of
to
# 在开头添加这几个特殊标志,并占用前几个字符
# 上一部得知,序号是从1开始,所以这里+3是正确的,即先把所有序号往后推3位,再添加特殊标志
word_index = {k:(v+3) for k,v in word_index.items()}
word_index["<PAD>"] = 0
word_index["<START>"] = 1
word_index["<UNK>"] = 2  # unknown
word_index["<UNUSED>"] = 3
#把字典啊{字符:序号}转化成{序号:字符}的形式
reverse_word_index = dict([(value, key) for (key, value) in word_index.items()])
for i in range(5):print(reverse_word_index[i])
<PAD>
<START>
<UNK>
<UNUSED>
the
# 定义一个函数,将序号文本转换成单词文本,用空格连接
#揭秘文档,text内容应该都是序号,要转换成字符
def decode_review(text):#把序号转换成字符,若有新字符,用?代替。最后并组成一个字符串return ' '.join([reverse_word_index.get(i, '?') for i in text])
text0=decode_review(train_data[0])
print(text0)
<START> this film was just brilliant casting location scenery story direction everyone's really suited the part they played and you could just imagine being there robert <UNK> is an amazing actor and now the same being director <UNK> father came from the same scottish island as myself so i loved the fact there was a real connection with this film the witty remarks throughout the film were great it was just brilliant so much that i bought the film as soon as it was released for <UNK> and would recommend it to everyone to watch and the fly fishing was amazing really cried at the end it was so sad and you know what they say if you cry at a film it must have been good and this definitely was also <UNK> to the two little boy's that played the <UNK> of norman and paul they were just brilliant children are often left out of the <UNK> list i think because the stars that play them all grown up are such a big profile for the whole film but these children are amazing and should be praised for what they have done don't you think the whole story was so lovely because it was true and was someone's life after all that was shared with us all
#影评长度标准化
train_data = keras.preprocessing.sequence.pad_sequences(train_data,value=word_index["<PAD>"],padding='post',maxlen=256)test_data = keras.preprocessing.sequence.pad_sequences(test_data,value=word_index["<PAD>"],padding='post',maxlen=256)
print(train_data[0])
[   1   14   22   16   43  530  973 1622 1385   65  458 4468   66 39414  173   36  256    5   25  100   43  838  112   50  670    2    935  480  284    5  150    4  172  112  167    2  336  385   39    4172 4536 1111   17  546   38   13  447    4  192   50   16    6  1472025   19   14   22    4 1920 4613  469    4   22   71   87   12   1643  530   38   76   15   13 1247    4   22   17  515   17   12   16626   18    2    5   62  386   12    8  316    8  106    5    4 22235244   16  480   66 3785   33    4  130   12   16   38  619    5   25124   51   36  135   48   25 1415   33    6   22   12  215   28   7752    5   14  407   16   82    2    8    4  107  117 5952   15  2564    2    7 3766    5  723   36   71   43  530  476   26  400  31746    7    4    2 1029   13  104   88    4  381   15  297   98   322071   56   26  141    6  194 7486   18    4  226   22   21  134  47626  480    5  144   30 5535   18   51   36   28  224   92   25  1044  226   65   16   38 1334   88   12   16  283    5   16 4472  113103   32   15   16 5345   19  178   32    0    0    0    0    0    00    0    0    0    0    0    0    0    0    0    0    0    0    00    0    0    0    0    0    0    0    0    0    0    0    0    00    0    0    0]
len(train_data[0]), len(train_data[1])
(256, 256)
#输入形状是用于电影评论的词汇计数(10,000字)
vocab_size = 10000model = keras.Sequential()
#第一层是 Embedding 层。该层会在整数编码的词汇表中查找每个字词-索引的嵌入向量。
#模型在接受训练时会学习这些向量。这些向量会向输出数组添加一个维度。生成的维度为:(batch, sequence, embedding)。
model.add(keras.layers.Embedding(vocab_size, 16))
# GlobalAveragePooling1D 层通过对序列维度求平均值,针对每个样本返回一个长度固定的输出向量。
#这样,模型便能够以尽可能简单的方式处理各种长度的输入。
model.add(keras.layers.GlobalAveragePooling1D())
#该长度固定的输出向量会传入一个全连接 (Dense) 层(包含 16 个隐藏单元)。
model.add(keras.layers.Dense(16, activation=tf.nn.relu))
model.add(keras.layers.Dropout(0.5))
#最后一层与单个输出节点密集连接。应用 sigmoid 激活函数后,结果是介于 0 到 1 之间的浮点值,表示概率或置信水平。
model.add(keras.layers.Dense(1, activation=tf.nn.sigmoid))model.summary()
WARNING:tensorflow:From F:\anaconda1\envs\baseline\lib\site-packages\tensorflow\python\ops\resource_variable_ops.py:435: colocate_with (from tensorflow.python.framework.ops) is deprecated and will be removed in a future version.
Instructions for updating:
Colocations handled automatically by placer.
WARNING:tensorflow:From F:\anaconda1\envs\baseline\lib\site-packages\tensorflow\python\keras\layers\core.py:143: calling dropout (from tensorflow.python.ops.nn_ops) with keep_prob is deprecated and will be removed in a future version.
Instructions for updating:
Please use `rate` instead of `keep_prob`. Rate should be set to `rate = 1 - keep_prob`.
_________________________________________________________________
Layer (type)                 Output Shape              Param #
=================================================================
embedding (Embedding)        (None, None, 16)          160000
_________________________________________________________________
global_average_pooling1d (Gl (None, 16)                0
_________________________________________________________________
dense (Dense)                (None, 16)                272
_________________________________________________________________
dropout (Dropout)            (None, 16)                0
_________________________________________________________________
dense_1 (Dense)              (None, 1)                 17
=================================================================
Total params: 160,289
Trainable params: 160,289
Non-trainable params: 0
_________________________________________________________________
#模型损失函数与指定优化函数
model.compile(optimizer=tf.train.AdamOptimizer(),loss='binary_crossentropy',metrics=['accuracy'])
#构建验证集
x_val = train_data[:10000]
partial_x_train = train_data[10000:]y_val = train_labels[:10000]
partial_y_train = train_labels[10000:]

#训练模型
history = model.fit(partial_x_train,partial_y_train,epochs=40,batch_size=512,validation_data=(x_val, y_val),verbose=1)
Train on 15000 samples, validate on 10000 samples
WARNING:tensorflow:From F:\anaconda1\envs\baseline\lib\site-packages\tensorflow\python\ops\math_ops.py:3066: to_int32 (from tensorflow.python.ops.math_ops) is deprecated and will be removed in a future version.
Instructions for updating:
Use tf.cast instead.
Epoch 1/40
15000/15000 [==============================] - 2s 122us/sample - loss: 0.6917 - acc: 0.5569 - val_loss: 0.6895 - val_acc: 0.7405
Epoch 2/40
15000/15000 [==============================] - 1s 57us/sample - loss: 0.6856 - acc: 0.6554 - val_loss: 0.6815 - val_acc: 0.7569
Epoch 3/40
15000/15000 [==============================] - 1s 56us/sample - loss: 0.6736 - acc: 0.7032 - val_loss: 0.6651 - val_acc: 0.7628
Epoch 4/40
15000/15000 [==============================] - 1s 59us/sample - loss: 0.6508 - acc: 0.7277 - val_loss: 0.6376 - val_acc: 0.7629
Epoch 5/40
15000/15000 [==============================] - 1s 75us/sample - loss: 0.6161 - acc: 0.7631 - val_loss: 0.6003 - val_acc: 0.7981
Epoch 6/40
15000/15000 [==============================] - 1s 57us/sample - loss: 0.5762 - acc: 0.7805 - val_loss: 0.5576 - val_acc: 0.8163
Epoch 7/40
15000/15000 [==============================] - 1s 72us/sample - loss: 0.5294 - acc: 0.8121 - val_loss: 0.5114 - val_acc: 0.8315
Epoch 8/40
15000/15000 [==============================] - 1s 63us/sample - loss: 0.4825 - acc: 0.8334 - val_loss: 0.4690 - val_acc: 0.8431
Epoch 9/40
15000/15000 [==============================] - 1s 58us/sample - loss: 0.4452 - acc: 0.8420 - val_loss: 0.4324 - val_acc: 0.8527
Epoch 10/40
15000/15000 [==============================] - 1s 58us/sample - loss: 0.4094 - acc: 0.8567 - val_loss: 0.4030 - val_acc: 0.8585
Epoch 11/40
15000/15000 [==============================] - 1s 54us/sample - loss: 0.3800 - acc: 0.8647 - val_loss: 0.3784 - val_acc: 0.8671
Epoch 12/40
15000/15000 [==============================] - 1s 53us/sample - loss: 0.3556 - acc: 0.8763 - val_loss: 0.3596 - val_acc: 0.8689
Epoch 13/40
15000/15000 [==============================] - 1s 55us/sample - loss: 0.3336 - acc: 0.8814 - val_loss: 0.3432 - val_acc: 0.8734
Epoch 14/40
15000/15000 [==============================] - 1s 55us/sample - loss: 0.3146 - acc: 0.8876 - val_loss: 0.3312 - val_acc: 0.8765
Epoch 15/40
15000/15000 [==============================] - 1s 55us/sample - loss: 0.2984 - acc: 0.8945 - val_loss: 0.3213 - val_acc: 0.8780
Epoch 16/40
15000/15000 [==============================] - 1s 58us/sample - loss: 0.2866 - acc: 0.8998 - val_loss: 0.3125 - val_acc: 0.8780
Epoch 17/40
15000/15000 [==============================] - 1s 55us/sample - loss: 0.2715 - acc: 0.9048 - val_loss: 0.3053 - val_acc: 0.8810
Epoch 18/40
15000/15000 [==============================] - 1s 57us/sample - loss: 0.2586 - acc: 0.9118 - val_loss: 0.3001 - val_acc: 0.8818
Epoch 19/40
15000/15000 [==============================] - 1s 56us/sample - loss: 0.2458 - acc: 0.9154 - val_loss: 0.2947 - val_acc: 0.8844
Epoch 20/40
15000/15000 [==============================] - 1s 59us/sample - loss: 0.2338 - acc: 0.9205 - val_loss: 0.2911 - val_acc: 0.8832
Epoch 21/40
15000/15000 [==============================] - 1s 59us/sample - loss: 0.2220 - acc: 0.9239 - val_loss: 0.2879 - val_acc: 0.8841
Epoch 22/40
15000/15000 [==============================] - 1s 60us/sample - loss: 0.2171 - acc: 0.9261 - val_loss: 0.2862 - val_acc: 0.8858
Epoch 23/40
15000/15000 [==============================] - 1s 59us/sample - loss: 0.2056 - acc: 0.9331 - val_loss: 0.2856 - val_acc: 0.8850
Epoch 24/40
15000/15000 [==============================] - 1s 59us/sample - loss: 0.1998 - acc: 0.9327 - val_loss: 0.2835 - val_acc: 0.8850
Epoch 25/40
15000/15000 [==============================] - 1s 53us/sample - loss: 0.1948 - acc: 0.9372 - val_loss: 0.2826 - val_acc: 0.8869
Epoch 26/40
15000/15000 [==============================] - 1s 57us/sample - loss: 0.1857 - acc: 0.9420 - val_loss: 0.2828 - val_acc: 0.8846
Epoch 27/40
15000/15000 [==============================] - 1s 61us/sample - loss: 0.1783 - acc: 0.9433 - val_loss: 0.2827 - val_acc: 0.8868
Epoch 28/40
15000/15000 [==============================] - 1s 62us/sample - loss: 0.1719 - acc: 0.9463 - val_loss: 0.2836 - val_acc: 0.8861
Epoch 29/40
15000/15000 [==============================] - 1s 59us/sample - loss: 0.1661 - acc: 0.9481 - val_loss: 0.2873 - val_acc: 0.8841
Epoch 30/40
15000/15000 [==============================] - 1s 54us/sample - loss: 0.1621 - acc: 0.9506 - val_loss: 0.2855 - val_acc: 0.8856
Epoch 31/40
15000/15000 [==============================] - 1s 54us/sample - loss: 0.1544 - acc: 0.9535 - val_loss: 0.2874 - val_acc: 0.8867
Epoch 32/40
15000/15000 [==============================] - 1s 55us/sample - loss: 0.1486 - acc: 0.9556 - val_loss: 0.2892 - val_acc: 0.8866
Epoch 33/40
15000/15000 [==============================] - 1s 54us/sample - loss: 0.1438 - acc: 0.9581 - val_loss: 0.2914 - val_acc: 0.8860
Epoch 34/40
15000/15000 [==============================] - 1s 59us/sample - loss: 0.1392 - acc: 0.9613 - val_loss: 0.2931 - val_acc: 0.8855
Epoch 35/40
15000/15000 [==============================] - 1s 53us/sample - loss: 0.1351 - acc: 0.9610 - val_loss: 0.2964 - val_acc: 0.8855
Epoch 36/40
15000/15000 [==============================] - 1s 56us/sample - loss: 0.1300 - acc: 0.9641 - val_loss: 0.2981 - val_acc: 0.8842
Epoch 37/40
15000/15000 [==============================] - 1s 53us/sample - loss: 0.1249 - acc: 0.9664 - val_loss: 0.3009 - val_acc: 0.8839
Epoch 38/40
15000/15000 [==============================] - 1s 54us/sample - loss: 0.1221 - acc: 0.9669 - val_loss: 0.3049 - val_acc: 0.8829
Epoch 39/40
15000/15000 [==============================] - 1s 58us/sample - loss: 0.1187 - acc: 0.9689 - val_loss: 0.3086 - val_acc: 0.8816
Epoch 40/40
15000/15000 [==============================] - 1s 56us/sample - loss: 0.1128 - acc: 0.9709 - val_loss: 0.3102 - val_acc: 0.8832

#训练模型
history = model.fit(partial_x_train,partial_y_train,epochs=40,batch_size=512,validation_data=(x_val, y_val),verbose=1)
Train on 15000 samples, validate on 10000 samples
Epoch 1/40
15000/15000 [==============================] - 1s 59us/sample - loss: 0.1097 - acc: 0.9719 - val_loss: 0.3141 - val_acc: 0.8821
Epoch 2/40
15000/15000 [==============================] - 1s 56us/sample - loss: 0.1073 - acc: 0.9721 - val_loss: 0.3164 - val_acc: 0.8813
Epoch 3/40
15000/15000 [==============================] - 1s 54us/sample - loss: 0.1040 - acc: 0.9743 - val_loss: 0.3202 - val_acc: 0.8824
Epoch 4/40
15000/15000 [==============================] - 1s 54us/sample - loss: 0.1001 - acc: 0.9763 - val_loss: 0.3233 - val_acc: 0.8811
Epoch 5/40
15000/15000 [==============================] - 1s 54us/sample - loss: 0.0977 - acc: 0.9760 - val_loss: 0.3278 - val_acc: 0.8799
Epoch 6/40
15000/15000 [==============================] - 1s 56us/sample - loss: 0.0947 - acc: 0.9774 - val_loss: 0.3362 - val_acc: 0.8771
Epoch 7/40
15000/15000 [==============================] - 1s 56us/sample - loss: 0.0914 - acc: 0.9777 - val_loss: 0.3355 - val_acc: 0.8788
Epoch 8/40
15000/15000 [==============================] - 1s 54us/sample - loss: 0.0881 - acc: 0.9802 - val_loss: 0.3405 - val_acc: 0.8787
Epoch 9/40
15000/15000 [==============================] - 1s 55us/sample - loss: 0.0846 - acc: 0.9815 - val_loss: 0.3447 - val_acc: 0.8777
Epoch 10/40
15000/15000 [==============================] - 1s 54us/sample - loss: 0.0812 - acc: 0.9829 - val_loss: 0.3486 - val_acc: 0.8789
Epoch 11/40
15000/15000 [==============================] - 1s 53us/sample - loss: 0.0799 - acc: 0.9835 - val_loss: 0.3526 - val_acc: 0.8782
Epoch 12/40
15000/15000 [==============================] - 1s 53us/sample - loss: 0.0779 - acc: 0.9825 - val_loss: 0.3611 - val_acc: 0.8754
Epoch 13/40
15000/15000 [==============================] - 1s 57us/sample - loss: 0.0768 - acc: 0.9839 - val_loss: 0.3636 - val_acc: 0.8757
Epoch 14/40
15000/15000 [==============================] - 1s 59us/sample - loss: 0.0712 - acc: 0.9853 - val_loss: 0.3686 - val_acc: 0.8758
Epoch 15/40
15000/15000 [==============================] - 1s 54us/sample - loss: 0.0704 - acc: 0.9865 - val_loss: 0.3728 - val_acc: 0.8774
Epoch 16/40
15000/15000 [==============================] - 1s 63us/sample - loss: 0.0677 - acc: 0.9865 - val_loss: 0.3804 - val_acc: 0.8760
Epoch 17/40
15000/15000 [==============================] - 1s 64us/sample - loss: 0.0667 - acc: 0.9865 - val_loss: 0.3824 - val_acc: 0.8773
Epoch 18/40
15000/15000 [==============================] - 1s 58us/sample - loss: 0.0653 - acc: 0.9869 - val_loss: 0.3937 - val_acc: 0.8726
Epoch 19/40
15000/15000 [==============================] - 1s 56us/sample - loss: 0.0615 - acc: 0.9879 - val_loss: 0.3931 - val_acc: 0.8763
Epoch 20/40
15000/15000 [==============================] - 1s 53us/sample - loss: 0.0600 - acc: 0.9891 - val_loss: 0.3983 - val_acc: 0.8752
Epoch 21/40
15000/15000 [==============================] - 1s 53us/sample - loss: 0.0591 - acc: 0.9893 - val_loss: 0.4023 - val_acc: 0.8762
Epoch 22/40
15000/15000 [==============================] - 1s 53us/sample - loss: 0.0572 - acc: 0.9898 - val_loss: 0.4078 - val_acc: 0.8754
Epoch 23/40
15000/15000 [==============================] - 1s 53us/sample - loss: 0.0545 - acc: 0.9907 - val_loss: 0.4136 - val_acc: 0.8750
Epoch 24/40
15000/15000 [==============================] - 1s 57us/sample - loss: 0.0527 - acc: 0.9900 - val_loss: 0.4196 - val_acc: 0.8740
Epoch 25/40
15000/15000 [==============================] - 1s 57us/sample - loss: 0.0515 - acc: 0.9905 - val_loss: 0.4248 - val_acc: 0.8743
Epoch 26/40
15000/15000 [==============================] - 1s 53us/sample - loss: 0.0493 - acc: 0.9909 - val_loss: 0.4310 - val_acc: 0.8738
Epoch 27/40
15000/15000 [==============================] - 1s 52us/sample - loss: 0.0468 - acc: 0.9928 - val_loss: 0.4392 - val_acc: 0.8719
Epoch 28/40
15000/15000 [==============================] - 1s 53us/sample - loss: 0.0479 - acc: 0.9916 - val_loss: 0.4440 - val_acc: 0.8726
Epoch 29/40
15000/15000 [==============================] - 1s 57us/sample - loss: 0.0452 - acc: 0.9924 - val_loss: 0.4491 - val_acc: 0.8719
Epoch 30/40
15000/15000 [==============================] - 1s 55us/sample - loss: 0.0445 - acc: 0.9928 - val_loss: 0.4543 - val_acc: 0.8717
Epoch 31/40
15000/15000 [==============================] - 1s 56us/sample - loss: 0.0424 - acc: 0.9931 - val_loss: 0.4633 - val_acc: 0.8708
Epoch 32/40
15000/15000 [==============================] - 1s 67us/sample - loss: 0.0411 - acc: 0.9933 - val_loss: 0.4677 - val_acc: 0.8702
Epoch 33/40
15000/15000 [==============================] - 1s 53us/sample - loss: 0.0404 - acc: 0.9930 - val_loss: 0.4732 - val_acc: 0.8705
Epoch 34/40
15000/15000 [==============================] - 1s 54us/sample - loss: 0.0385 - acc: 0.9941 - val_loss: 0.4791 - val_acc: 0.8702
Epoch 35/40
15000/15000 [==============================] - 1s 53us/sample - loss: 0.0363 - acc: 0.9949 - val_loss: 0.4854 - val_acc: 0.8702
Epoch 36/40
15000/15000 [==============================] - 1s 54us/sample - loss: 0.0379 - acc: 0.9935 - val_loss: 0.4895 - val_acc: 0.8696
Epoch 37/40
15000/15000 [==============================] - 1s 54us/sample - loss: 0.0353 - acc: 0.9949 - val_loss: 0.5010 - val_acc: 0.8680
Epoch 38/40
15000/15000 [==============================] - 1s 53us/sample - loss: 0.0336 - acc: 0.9955 - val_loss: 0.5022 - val_acc: 0.8693
Epoch 39/40
15000/15000 [==============================] - 1s 53us/sample - loss: 0.0330 - acc: 0.9953 - val_loss: 0.5120 - val_acc: 0.8680
Epoch 40/40
15000/15000 [==============================] - 1s 61us/sample - loss: 0.0333 - acc: 0.9949 - val_loss: 0.5170 - val_acc: 0.8678
#评估模型
results = model.evaluate(test_data, test_labels)print(results)
25000/25000 [==============================] - 0s 18us/sample - loss: 0.5483 - acc: 0.8566
[0.5482739968276024, 0.85664]
#创建准确率和损失随时间变化的图
history_dict = history.history
history_dict.keys()
dict_keys(['loss', 'acc', 'val_loss', 'val_acc'])
#导入做图包matplotlib
import matplotlib.pyplot as plt
#赋值
acc = history.history['acc']
val_acc = history.history['val_acc']
loss = history.history['loss']
val_loss = history.history['val_loss']#损失图
epochs = range(1, len(acc) + 1)plt.plot(epochs, loss, 'bo', label = 'Training loss')     #bo 蓝点
plt.plot(epochs, val_loss, 'b', label = 'Validation loss')     #b 蓝线
plt.title('Training and Validation loss')
plt.xlabel('Epochs')
plt.ylabel('Loss')
plt.legend()
plt.show()

png


plt.clf()   # 清图
acc_values = history_dict['acc']
val_acc_values = history_dict['val_acc']plt.plot(epochs, acc, 'bo', label='Training acc')
plt.plot(epochs, val_acc, 'b', label='Validation acc')
plt.title('Training and validation accuracy')
plt.xlabel('Epochs')
plt.ylabel('Accuracy')
plt.legend()plt.show()

png

3.THUCNews数据子集探索

import pandas as pd
import numpy as np
import tensorflow as tf
# 训练集数据
train_data=pd.read_csv('./cnews.train.txt',sep='\t',engine='python',names=['label','content'],encoding='UTF-8')
print(train_data.shape)
train_data.head()
(50000, 2)
.dataframe tbody tr th {vertical-align: top;
}.dataframe thead th {text-align: right;
}
label content
0 体育 马晓旭意外受伤让国奥警惕 无奈大雨格外青睐殷家军记者傅亚雨沈阳报道 来到沈阳,国奥队依然没有...
1 体育 商瑞华首战复仇心切 中国玫瑰要用美国方式攻克瑞典多曼来了,瑞典来了,商瑞华首战求3分的信心也...
2 体育 冠军球队迎新欢乐派对 黄旭获大奖张军赢下PK赛新浪体育讯12月27日晚,“冠军高尔夫球队迎新...
3 体育 辽足签约危机引注册难关 高层威逼利诱合同笑里藏刀新浪体育讯2月24日,辽足爆发了集体拒签风波...
4 体育 揭秘谢亚龙被带走:总局电话骗局 复制南杨轨迹体坛周报特约记者张锐北京报道 谢亚龙已经被公安...
test_data = pd.read_csv('./cnews.test.txt',sep='\t',engine='python',names=['label','content'],encoding='UTF-8')
print(test_data.shape)
test_data.head()
(10000, 2)
.dataframe tbody tr th {vertical-align: top;
}.dataframe thead th {text-align: right;
}
label content
0 体育 鲍勃库西奖归谁属? NCAA最强控卫是坎巴还是弗神新浪体育讯如今,本赛季的NCAA进入到了末...
1 体育 麦基砍28+18+5却充满寂寞 纪录之夜他的痛阿联最懂新浪体育讯上天对每个人都是公平的,贾维...
2 体育 黄蜂vs湖人首发:科比冲击七连胜 火箭两旧将登场新浪体育讯北京时间3月28日,NBA常规赛洛...
3 体育 双面谢亚龙作秀终成做作 谁来为低劣行政能力埋单是谁任命了谢亚龙?谁放纵了谢亚龙?谁又该为谢亚...
4 体育 兔年首战山西换帅后有虎胆 张学文用乔丹名言励志今晚客场挑战浙江稠州银行队,是山西汾酒男篮的兔...
# 验证集数据
validation_data = pd.read_csv('./cnews.val.txt',sep='\t',engine='python',names=['label','content'],encoding='UTF-8')
print(test_data.shape)
validation_data.head()
(10000, 2)
.dataframe tbody tr th {vertical-align: top;
}.dataframe thead th {text-align: right;
}
label content
0 体育 黄蜂vs湖人首发:科比带伤战保罗 加索尔救赎之战 新浪体育讯北京时间4月27日,NBA季后赛...
1 体育 1.7秒神之一击救马刺王朝于危难 这个新秀有点牛!新浪体育讯在刚刚结束的比赛中,回到主场的马...
2 体育 1人灭掘金!神般杜兰特! 他想要分的时候没人能挡新浪体育讯在NBA的世界里,真的猛男,敢于直...
3 体育 韩国国奥20人名单:朴周永领衔 两世界杯国脚入选新浪体育讯据韩联社首尔9月17日电 韩国国奥...
4 体育 天才中锋崇拜王治郅 周琦:球员最终是靠实力说话2月14日从土耳其男篮邀请赛回到北京之后,周琦...

查看下训练集总共有多少种类别,以及各类别的数量

s=train_data['label'].value_counts()
print(s)
财经    5000
科技    5000
娱乐    5000
时政    5000
房产    5000
游戏    5000
家居    5000
体育    5000
教育    5000
时尚    5000
Name: label, dtype: int64
label2id_dict={x:i for i,x in enumerate(train_data['label'].value_counts().index)}
print(label2id_dict)
{'教育': 0, '体育': 1, '娱乐': 2, '家居': 3, '游戏': 4, '时尚': 5, '财经': 6, '时政': 7, '科技': 8, '房产': 9}

数据预处理

1.通过训练集数据,建立自己的字典

from collections import Counter
def build_voca_txt(train_dir,save_path,vocal_size=5000):"""创建字典文件"""train_data=pd.read_csv(train_dir,sep='\t',engine='python',names=['labels',
  File "<ipython-input-11-9c28e9d9e577>", line 6train_data=pd.read_csv(train_dir,sep='\t'^
SyntaxError: unexpected EOF while parsing
from collections import Counter
def build_voca_txt(train_dir, save_path, vocab_size=5000):"""创建字典文件"""train_data = pd.read_csv(train_dir,sep='\t',engine='python',names=['label','content'],encoding='UTF-8')df = train_data['content'].apply(lambda x:[word for word in x],1)print(df.head())all_data = []for line in df:all_data.extend(line)#学习Counter类的使用,all_data为一维列表counter = Counter(all_data)#去出现次数最多前5000-1个count_pairs = counter.most_common(vocab_size - 1)#只取字符,不取个数words, _ = list(zip(*count_pairs))#添加<PAD>标识符words = ['<PAD>'] + list(words)#保存到文件里open(save_path, mode='w',encoding='utf-8').write('\n'.join(words) + '\n')build_voca_txt('./cnews.train.txt','./vocab.txt')
0    [马, 晓, 旭, 意, 外, 受, 伤, 让, 国, 奥, 警, 惕,  , 无, 奈, ...
1    [商, 瑞, 华, 首, 战, 复, 仇, 心, 切,  , 中, 国, 玫, 瑰, 要, ...
2    [冠, 军, 球, 队, 迎, 新, 欢, 乐, 派, 对,  , 黄, 旭, 获, 大, ...
3    [辽, 足, 签, 约, 危, 机, 引, 注, 册, 难, 关,  , 高, 层, 威, ...
4    [揭, 秘, 谢, 亚, 龙, 被, 带, 走, :, 总, 局, 电, 话, 骗, 局, ...
Name: content, dtype: object

2、读取字典的方法,供后续使用

def read_vocab(vocab_path):"""读取字典,保存格式:{字符:序号}"""vocab_dict = {}with open(vocab_path,encoding='utf-8') as f:for i,word in enumerate(f):vocab_dict[word[:-1]] = ireturn vocab_dictvocab_dict = read_vocab('./vocab.txt')
print(len(vocab_dict))
print(vocab_dict.items())
5000
dict_items([('<PAD>', 0), (',', 1), ('的', 2), ('。', 3), ('一', 4), ('是', 5), ('在', 6), ('0', 7), ('有', 8), ('不', 9), ('了', 10), ('中', 11), ('1', 12), ('人', 13), ('大', 14), ('、', 15), ('国', 16), (' ', 17), ('2', 18), ('这', 19), ('上', 20), ('为', 21), ('个', 22), ('“', 23), ('”', 24), ('年', 25), ('学', 26), ('时', 27), ('我', 28), ('地', 29), ('和', 30), ('以', 31), ('到', 32), ('出', 33), ('来', 34), ('会', 35), ('行', 36), ('发', 37), (':', 38), ('对', 39), ('们', 40), ('要', 41), ('生', 42), ('家', 43), ('他', 44), ('能', 45), ('也', 46), ('业', 47), ('金', 48), ('3', 49), ('成', 50), ('可', 51), ('分', 52), ('多', 53), ('现', 54), ('5', 55), ('就', 56), ('场', 57), ('新', 58), ('后', 59), ('于', 60), ('下', 61), ('日', 62), ('经', 63), ('市', 64), ('前', 65), ('过', 66), ('方', 67), ('得', 68), ('作', 69), ('月', 70), ('最', 71), ('开', 72), ('房', 73), ('》', 74), ('《', 75), ('高', 76), ('9', 77), ('8', 78), ('.', 79), ('而', 80), ('比', 81), ('公', 82), ('4', 83), ('说', 84), (')', 85), ('将', 86), ('(', 87), ('都', 88), ('资', 89), ('e', 90), ('6', 91), ('基', 92), ('用', 93), ('面', 94), ('产', 95), ('还', 96), ('自', 97), ('者', 98), ('本', 99), ('之', 100), ('美', 101), ('\xa0', 102), ('很', 103), ('同', 104), ('7', 105), ('部', 106), ('进', 107), ('但', 108), ('主', 109), ('外', 110), ('动', 111), ('机', 112), ('元', 113), ('理', 114), ('加', 115), ('a', 116), ('全', 117), ('与', 118), ('实', 119), ('影', 120), ('好', 121), ('小', 122), ('间', 123), ('其', 124), ('天', 125), ('定', 126), ('表', 127), ('力', 128), ('如', 129), ('次', 130), ('合', 131), ('长', 132), ('o', 133), ('体', 134), ('价', 135), ('i', 136), ('所', 137), ('内', 138), ('子', 139), ('目', 140), ('电', 141), ('-', 142), ('当', 143), ('度', 144), ('品', 145), ('看', 146), ('期', 147), ('关', 148), ('更', 149), ('n', 150), ('等', 151), ('工', 152), ('然', 153), ('斯', 154), ('重', 155), ('些', 156), ('球', 157), ('此', 158), ('里', 159), ('利', 160), ('相', 161), ('情', 162), ('投', 163), ('点', 164), ('没', 165), ('因', 166), ('已', 167), ('三', 168), ('心', 169), ('特', 170), ('明', 171), ('位', 172), ('两', 173), ('法', 174), ('从', 175), ('入', 176), ('名', 177), ('万', 178), ('手', 179), ('计', 180), ('性', 181), ('事', 182), ('只', 183), ('样', 184), ('示', 185), ('r', 186), ('种', 187), ('报', 188), ('海', 189), ('平', 190), ('数', 191), ('%', 192), ('第', 193), ('并', 194), ('色', 195), ('建', 196), ('据', 197), ('提', 198), ('商', 199), ('员', 200), ('通', 201), ('去', 202), ('民', 203), ('t', 204), ('着', 205), ('你', 206), ('片', 207), ('展', 208), ('道', 209), ('文', 210), ('演', 211), ('赛', 212), ('区', 213), ('交', 214), ('意', 215), ('政', 216), ('么', 217), ('今', 218), ('让', 219), ('起', 220), ('信', 221), ('化', 222), ('银', 223), ('记', 224), ('司', 225), ('北', 226), ('游', 227), ('科', 228), ('戏', 229), ('被', 230), ('格', 231), ('保', 232), ('及', 233), ('常', 234), ('物', 235), ('问', 236), ('s', 237), ('量', 238), ('制', 239), ('持', 240), ('果', 241), ('感', 242), ('设', 243), ('队', 244), ('无', 245), ('收', 246), ('正', 247), ('应', 248), ('?', 249), ('那', 250), ('活', 251), ('身', 252), ('式', 253), ('打', 254), ('l', 255), ('系', 256), ('尔', 257), ('总', 258), ('京', 259), ('A', 260), ('至', 261), ('己', 262), ('务', 263), ('受', 264), ('想', 265), ('星', 266), ('回', 267), ('留', 268), ('由', 269), ('网', 270), ('达', 271), ('认', 272), ('做', 273), ('题', 274), ('选', 275), ('费', 276), ('城', 277), ('增', 278), ('近', 279), ('华', 280), ('风', 281), ('非', 282), ('战', 283), ('布', 284), ('该', 285), ('接', 286), ('款', 287), ('项', 288), ('S', 289), ('英', 290), ('女', 291), ('程', 292), ('导', 293), ('管', 294), ('二', 295), ('强', 296), ('证', 297), ('水', 298), ('代', 299), ('调', 300), ('少', 301), ('专', 302), ('型', 303), ('台', 304), ('给', 305), ('需', 306), ('规', 307), ('图', 308), ('周', 309), ('德', 310), ('解', 311), ('各', 312), ('C', 313), ('向', 314), (';', 315), ('别', 316), ('股', 317), ('东', 318), ('结', 319), ('或', 320), ('首', 321), ('士', 322), ('西', 323), ('安', 324), ('教', 325), ('变', 326), ('火', 327), ('节', 328), ('际', 329), ('任', 330), ('单', 331), ('先', 332), ('再', 333), ('观', 334), ('校', 335), ('显', 336), ('克', 337), ('组', 338), ('直', 339), ('装', 340), ('求', 341), ('才', 342), ('率', 343), ('较', 344), ('造', 345), ('使', 346), ('每', 347), ('考', 348), ('亿', 349), ('请', 350), ('流', 351), ('完', 352), ('拍', 353), ('取', 354), ('院', 355), ('线', 356), ('门', 357), ('放', 358), ('世', 359), ('住', 360), ('续', 361), ('联', 362), ('张', 363), ('P', 364), ('息', 365), ('空', 366), ('c', 367), ('研', 368), ('它', 369), ('十', 370), ('立', 371), ('原', 372), ('易', 373), ('整', 374), ('—', 375), ('术', 376), ('论', 377), ('消', 378), ('太', 379), ('知', 380), ('王', 381), ('质', 382), ('约', 383), ('客', 384), ('几', 385), ('配', 386), ('马', 387), ('统', 388), ('值', 389), ('T', 390), ('头', 391), ('件', 392), ('带', 393), ('服', 394), ('她', 395), ('界', 396), ('指', 397), ('D', 398), ('级', 399), ('企', 400), ('传', 401), ('老', 402), ('类', 403), ('始', 404), ('气', 405), ('I', 406), ('户', 407), ('超', 408), ('育', 409), ('未', 410), ('具', 411), ('m', 412), ('低', 413), ('济', 414), ('处', 415), ('技', 416), ('望', 417), ('把', 418), ('M', 419), ('究', 420), ('什', 421), ('热', 422), ('推', 423), ('称', 424), ('购', 425), ('!', 426), ('季', 427), ('米', 428), ('光', 429), ('广', 430), ('份', 431), ('乐', 432), ('又', 433), ('获', 434), ('真', 435), ('觉', 436), ('E', 437), ('玩', 438), ('形', 439), ('集', 440), ('备', 441), ('优', 442), ('领', 443), ('势', 444), ('h', 445), ('楼', 446), ('准', 447), ('包', 448), ('像', 449), ('则', 450), ('难', 451), ('爱', 452), ('四', 453), ('申', 454), ('B', 455), ('d', 456), ('售', 457), ('u', 458), ('快', 459), ('连', 460), ('话', 461), ('师', 462), ('告', 463), ('何', 464), ('视', 465), ('确', 466), ('深', 467), ('预', 468), ('局', 469), ('亚', 470), ('评', 471), ('票', 472), ('卡', 473), ('改', 474), ('候', 475), ('买', 476), ('况', 477), ('存', 478), ('支', 479), ('拉', 480), ('仅', 481), ('办', 482), ('注', 483), ('反', 484), ('环', 485), ('供', 486), ('角', 487), ('篮', 488), ('标', 489), ('转', 490), ('拿', 491), ('运', 492), ('参', 493), ('升', 494), ('众', 495), ('O', 496), ('/', 497), ('创', 498), ('浪', 499), ('陈', 500), ('精', 501), ('号', 502), ('见', 503), ('助', 504), ('且', 505), ('土', 506), ('半', 507), ('议', 508), ('花', 509), ('步', 510), ('策', 511), ('南', 512), ('板', 513), ('居', 514), ('友', 515), ('越', 516), ('功', 517), ('构', 518), ('贷', 519), ('划', 520), ('模', 521), ('山', 522), ('融', 523), ('社', 524), ('G', 525), ('决', 526), ('共', 527), ('案', 528), ('g', 529), ('销', 530), ('走', 531), ('套', 532), ('路', 533), ('即', 534), ('言', 535), ('容', 536), ('均', 537), ('试', 538), ('积', 539), ('团', 540), ('府', 541), ('查', 542), ('条', 543), ('限', 544), ('引', 545), ('随', 546), ('择', 547), ('希', 548), ('口', 549), ('奇', 550), ('涨', 551), ('港', 552), ('盘', 553), ('象', 554), ('置', 555), ('林', 556), ('益', 557), ('效', 558), ('神', 559), ('极', 560), ('语', 561), ('复', 562), ('够', 563), ('阿', 564), ('币', 565), ('根', 566), ('州', 567), ('历', 568), ('采', 569), ('奖', 570), ('终', 571), ('适', 572), ('N', 573), ('尼', 574), ('命', 575), ('段', 576), ('景', 577), ('险', 578), ('却', 579), ('失', 580), ('军', 581), ('权', 582), ('车', 583), ('L', 584), ('剧', 585), ('速', 586), ('攻', 587), ('许', 588), ('足', 589), ('算', 590), ('清', 591), ('争', 592), ('响', 593), ('移', 594), ('红', 595), ('必', 596), ('幅', 597), ('额', 598), ('y', 599), ('讯', 600), ('照', 601), ('源', 602), ('李', 603), ('验', 604), ('双', 605), ('刚', 606), ('另', 607), ('态', 608), ('p', 609), ('致', 610), ('底', 611), ('除', 612), ('满', 613), ('击', 614), ('白', 615), ('五', 616), ('往', 617), ('喜', 618), ('财', 619), ('防', 620), ('境', 621), ('排', 622), ('百', 623), ('降', 624), ('远', 625), ('书', 626), ('习', 627), ('龙', 628), ('债', 629), ('钱', 630), ('断', 631), ('富', 632), ('曾', 633), ('测', 634), ('签', 635), ('举', 636), ('飞', 637), ('便', 638), ('介', 639), ('博', 640), ('牌', 641), ('虽', 642), ('料', 643), ('例', 644), ('边', 645), ('罗', 646), ('搭', 647), ('香', 648), ('委', 649), ('营', 650), ('器', 651), ('R', 652), ('落', 653), ('跟', 654), ('列', 655), ('仍', 656), ('职', 657), ('尚', 658), ('阳', 659), ('监', 660), ('券', 661), ('儿', 662), ('尽', 663), ('衣', 664), ('负', 665), ('短', 666), ('找', 667), ('层', 668), ('黄', 669), ('艺', 670), ('域', 671), ('施', 672), ('F', 673), ('离', 674), ('波', 675), ('胜', 676), ('兰', 677), ('古', 678), ('录', 679), ('黑', 680), ('素', 681), ('普', 682), ('史', 683), ('版', 684), ('摄', 685), ('官', 686), ('否', 687), ('石', 688), ('·', 689), ('站', 690), ('w', 691), ('访', 692), (',', 693), ('初', 694), ('细', 695), ('继', 696), ('责', 697), ('括', 698), ('卫', 699), ('露', 700), ('协', 701), ('轻', 702), ('维', 703), ('澳', 704), ('纪', 705), ('欢', 706), ('卖', 707), ('早', 708), ('绩', 709), ('穿', 710), ('孩', 711), ('按', 712), ('眼', 713), ('围', 714), ('男', 715), ('依', 716), ('宝', 717), ('控', 718), ('b', 719), ('读', 720), ('状', 721), ('洲', 722), ('密', 723), ('差', 724), ('奥', 725), ('破', 726), ('块', 727), ('突', 728), ('…', 729), ('思', 730), ('画', 731), ('巴', 732), ('纳', 733), ('范', 734), ('映', 735), ('充', 736), ('媒', 737), ('室', 738), ('H', 739), ('材', 740), ('字', 741), ('武', 742), ('跌', 743), ('春', 744), ('湖', 745), ('简', 746), ('担', 747), ('欧', 748), ('谈', 749), ('切', 750), ('兴', 751), ('刘', 752), ('彩', 753), ('V', 754), ('稳', 755), ('待', 756), ('箭', 757), ('属', 758), ('声', 759), ('课', 760), ('透', 761), ('紧', 762), ('温', 763), ('绝', 764), ('园', 765), ('修', 766), ('农', 767), ('严', 768), ('减', 769), ('江', 770), ('讲', 771), ('航', 772), ('似', 773), ('独', 774), ('背', 775), ('夫', 776), ('甚', 777), ('志', 778), ('牛', 779), ('亮', 780), ('故', 781), ('W', 782), ('f', 783), ('汇', 784), ('义', 785), ('换', 786), ('货', 787), ('令', 788), ('饰', 789), ('招', 790), ('医', 791), ('占', 792), ('音', 793), ('群', 794), ('竞', 795), ('乎', 796), ('护', 797), ('姆', 798), ('席', 799), ('湾', 800), ('略', 801), ('央', 802), ('怎', 803), ('岁', 804), ('亲', 805), ('送', 806), ('补', 807), ('青', 808), ('索', 809), ('批', 810), ('核', 811), ('帮', 812), ('福', 813), ('伤', 814), ('v', 815), ('昨', 816), ('念', 817), ('激', 818), ('陆', 819), ('危', 820), ('巨', 821), ('省', 822), ('宣', 823), ('般', 824), ('筑', 825), ('k', 826), ('识', 827), ('守', 828), ('压', 829), ('错', 830), ('免', 831), ('店', 832), ('宅', 833), ('庭', 834), ('承', 835), ('雷', 836), ('云', 837), ('味', 838), ('典', 839), ('听', 840), ('笑', 841), ('登', 842), ('假', 843), ('审', 844), ('绍', 845), ('诉', 846), ('毕', 847), ('迷', 848), ('威', 849), ('谢', 850), ('练', 851), ('丽', 852), ('止', 853), ('微', 854), ('频', 855), ('净', 856), ('森', 857), ('拥', 858), ('须', 859), ('左', 860), ('印', 861), ('追', 862), ('秀', 863), ('托', 864), ('吴', 865), ('副', 866), ('疑', 867), ('千', 868), ('治', 869), ('冰', 870), ('右', 871), ('松', 872), ('晚', 873), ('皮', 874), ('K', 875), ('佳', 876), ('夏', 877), ('呢', 878), ('魔', 879), ('缺', 880), ('编', 881), ('析', 882), ('钟', 883), ('刻', 884), ('遇', 885), ('停', 886), ('写', 887), ('付', 888), ('食', 889), ('织', 890), ('闻', 891), ('检', 892), ('礼', 893), ('惊', 894), ('莱', 895), ('余', 896), ('死', 897), ('雅', 898), ('善', 899), ('干', 900), ('愿', 901), ('爆', 902), ('某', 903), ('端', 904), ('探', 905), ('述', 906), ('吧', 907), ('执', 908), ('村', 909), ('租', 910), ('健', 911), ('阵', 912), ('律', 913), ('虑', 914), ('临', 915), ('冲', 916), ('盟', 917), ('六', 918), ('吸', 919), ('束', 920), ('射', 921), ('久', 922), ('馆', 923), ('暴', 924), ('折', 925), ('苏', 926), ('顿', 927), ('借', 928), ('宇', 929), ('U', 930), ('病', 931), ('盛', 932), ('藏', 933), ('杰', 934), ('灵', 935), ('异', 936), ('察', 937), ('震', 938), ('退', 939), ('朋', 940), ('旅', 941), ('抢', 942), ('韩', 943), ('封', 944), ('轮', 945), ('康', 946), ('弹', 947), ('互', 948), ('伦', 949), ('败', 950), ('午', 951), ('河', 952), ('杀', 953), ('私', 954), ('镜', 955), ('扁', 956), ('潮', 957), ('幕', 958), ('旗', 959), ('党', 960), ('休', 961), ('八', 962), ('悉', 963), ('瑞', 964), ('逐', 965), ('征', 966), ('坚', 967), ('绿', 968), ('班', 969), ('迎', 970), ('吃', 971), ('母', 972), ('族', 973), ('税', 974), ('良', 975), ('丰', 976), ('训', 977), ('秘', 978), ('娱', 979), ('哈', 980), ('警', 981), ('伟', 982), ('您', 983), ('歌', 984), ('烈', 985), ('哪', 986), ('挑', 987), ('享', 988), ('肯', 989), ('凯', 990), ('顾', 991), ('杨', 992), ('丹', 993), ('雄', 994), ('键', 995), ('靠', 996), ('针', 997), ('木', 998), ('估', 999), ('届', 1000), ('?', 1001), ('嘉', 1002), ('洛', 1003), ('答', 1004), ('七', 1005), ('裙', 1006), ('岛', 1007), ('距', 1008), ('刺', 1009), ('趣', 1010), ('X', 1011), ('养', 1012), ('九', 1013), ('座', 1014), ('阶', 1015), ('庆', 1016), ('街', 1017), ('释', 1018), (':', 1019), ('扩', 1020), ('洋', 1021), ('永', 1022), ('顺', 1023), ('障', 1024), ('盖', 1025), ('勒', 1026), ('遭', 1027), ('铁', 1028), ('笔', 1029), ('启', 1030), ('判', 1031), ('倍', 1032), ('豪', 1033), ('吗', 1034), ('杂', 1035), ('哥', 1036), ('纷', 1037), ('婚', 1038), ('斗', 1039), ('秒', 1040), ('犯', 1041), ('剑', 1042), ('沙', 1043), ('派', 1044), ('归', 1045), ('操', 1046), ('扮', 1047), ('损', 1048), ('仓', 1049), ('延', 1050), ('暖', 1051), ('贵', 1052), ('档', 1053), ('载', 1054), ('丝', 1055), ('末', 1056), ('截', 1057), ('促', 1058), ('竟', 1059), ('困', 1060), ('油', 1061), ('泰', 1062), ('梦', 1063), ('播', 1064), ('革', 1065), ('络', 1066), ('熟', 1067), ('Q', 1068), ('酒', 1069), ('顶', 1070), ('础', 1071), (')', 1072), ('倒', 1073), ('著', 1074), ('’', 1075), ('麦', 1076), ('章', 1077), ('宁', 1078), ('雪', 1079), ('父', 1080), ('授', 1081), ('血', 1082), ('裤', 1083), ('静', 1084), ('诺', 1085), ('罚', 1086), ('输', 1087), ('润', 1088), ('害', 1089), ('船', 1090), ('+', 1091), ('掉', 1092), ('蓝', 1093), ('伊', 1094), ('脑', 1095), ('避', 1096), ('尤', 1097), ('赵', 1098), ('缩', 1099), ('综', 1100), ('挥', 1101), ('叫', 1102), ('储', 1103), ('镇', 1104), ('寻', 1105), ('怪', 1106), ('鲁', 1107), ('冠', 1108), ('(', 1109), ('努', 1110), ('丁', 1111), ('‘', 1112), ('坛', 1113), ('恩', 1114), ('概', 1115), ('扣', 1116), ('旧', 1117), ('趋', 1118), ('培', 1119), ('裁', 1120), ('屋', 1121), ('J', 1122), ('宽', 1123), ('汉', 1124), ('讨', 1125), ('谁', 1126), ('渐', 1127), ('账', 1128), ('涉', 1129), ('岸', 1130), ('胡', 1131), ('毛', 1132), ('锋', 1133), ('迪', 1134), ('幸', 1135), ('偏', 1136), ('秋', 1137), ('菲', 1138), ('码', 1139), ('纯', 1140), ('叶', 1141), ('峰', 1142), ('圣', 1143), ('兵', 1144), ('救', 1145), ('暗', 1146), ('鞋', 1147), ('冬', 1148), ('冷', 1149), ('蒂', 1150), ('侠', 1151), ('董', 1152), ('恐', 1153), ('熊', 1154), ('沃', 1155), ('献', 1156), ('惠', 1157), ('圈', 1158), ('朝', 1159), ('询', 1160), ('药', 1161), ('智', 1162), ('予', 1163), ('既', 1164), ('急', 1165), ('吉', 1166), ('曼', 1167), ('赢', 1168), ('姚', 1169), ('替', 1170), ('塔', 1171), ('狂', 1172), ('跳', 1173), ('抗', 1174), ('误', 1175), ('触', 1176), ('夜', 1177), ('朗', 1178), ('坦', 1179), ('附', 1180), ('慢', 1181), ('励', 1182), ('鱼', 1183), ('含', 1184), ('累', 1185), ('措', 1186), ('若', 1187), ('怀', 1188), ('贸', 1189), ('雨', 1190), ('草', 1191), ('苦', 1192), ('徐', 1193), ('贴', 1194), ('荣', 1195), ('孙', 1196), ('晓', 1197), ('脚', 1198), ('迅', 1199), ('聚', 1200), ('违', 1201), ('厅', 1202), ('募', 1203), ('鲜', 1204), ('潜', 1205), ('圆', 1206), ('餐', 1207), ('坐', 1208), ('仔', 1209), ('勇', 1210), ('软', 1211), ('莫', 1212), ('伯', 1213), ('梅', 1214), ('圳', 1215), ('呈', 1216), ('宾', 1217), ('库', 1218), ('凭', 1219), ('掌', 1220), ('焦', 1221), ('俄', 1222), ('漫', 1223), ('灾', 1224), ('曲', 1225), ('佛', 1226), ('怕', 1227), ('谓', 1228), ('劳', 1229), ('贝', 1230), ('廉', 1231), ('符', 1232), ('暂', 1233), ('唯', 1234), ('玉', 1235), ('詹', 1236), ('珍', 1237), ('舒', 1238), ('遗', 1239), ('x', 1240), ('厚', 1241), ('恒', 1242), ('跑', 1243), ('遍', 1244), ('隆', 1245), ('序', 1246), ('词', 1247), ('幻', 1248), ('舞', 1249), ('混', 1250), ('粉', 1251), ('灰', 1252), ('田', 1253), ('野', 1254), ('赴', 1255), ('宏', 1256), ('邮', 1257), ('硬', 1258), ('宜', 1259), ('帅', 1260), ('架', 1261), ('揭', 1262), ('堂', 1263), ('霸', 1264), ('呼', 1265), ('敌', 1266), ('纽', 1267), ('疗', 1268), ('塞', 1269), ('杜', 1270), ('珠', 1271), ('唐', 1272), ('罪', 1273), ('韦', 1274), ('辛', 1275), ('乡', 1276), ('零', 1277), ('迹', 1278), ('固', 1279), ('颜', 1280), ('坏', 1281), ('挂', 1282), ('树', 1283), ('戴', 1284), ('翻', 1285), ('帝', 1286), ('闭', 1287), ('川', 1288), ('撞', 1289), ('z', 1290), ('册', 1291), ('Y', 1292), ('楚', 1293), ('妈', 1294), ('弱', 1295), ('抵', 1296), ('猫', 1297), ('夺', 1298), ('召', 1299), ('埃', 1300), ('腿', 1301), ('筹', 1302), ('握', 1303), ('猛', 1304), ('齐', 1305), ('萨', 1306), ('诚', 1307), ('巧', 1308), ('摆', 1309), ('邀', 1310), ('辉', 1311), ('弃', 1312), ('弟', 1313), ('剩', 1314), ('谋', 1315), ('繁', 1316), ('闲', 1317), ('>', 1318), ('途', 1319), ('钢', 1320), ('衡', 1321), ('厂', 1322), ('拟', 1323), ('默', 1324), ('弗', 1325), ('恶', 1326), ('沉', 1327), ('锦', 1328), ('署', 1329), ('搞', 1330), ('赞', 1331), ('墙', 1332), ('伴', 1333), ('纹', 1334), ('兽', 1335), ('甲', 1336), ('扬', 1337), ('乔', 1338), ('赶', 1339), ('衫', 1340), ('薪', 1341), ('毫', 1342), ('迈', 1343), ('滑', 1344), ('订', 1345), ('禁', 1346), ('散', 1347), ('恋', 1348), ('隐', 1349), ('【', 1350), ('】', 1351), ('津', 1352), ('缓', 1353), ('泽', 1354), ('牙', 1355), ('腰', 1356), ('旦', 1357), ('童', 1358), ('霍', 1359), ('榜', 1360), ('冯', 1361), ('脱', 1362), ('跃', 1363), ('梁', 1364), ('植', 1365), ('肉', 1366), ('仪', 1367), ('醒', 1368), ('郭', 1369), ('晨', 1370), ('掘', 1371), ('涛', 1372), ('"', 1373), ('详', 1374), ('龄', 1375), ('脸', 1376), ('朱', 1377), ('洁', 1378), ('鼓', 1379), ('姐', 1380), ('侦', 1381), ('仙', 1382), ('洞', 1383), ('桥', 1384), ('骨', 1385), ('枪', 1386), ('晶', 1387), ('洗', 1388), ('亏', 1389), ('句', 1390), ('亡', 1391), ('乱', 1392), ('坡', 1393), ('骑', 1394), ('颗', 1395), ('胸', 1396), ('贡', 1397), ('啊', 1398), ('搜', 1399), ('宗', 1400), ('灯', 1401), ('染', 1402), ('奋', 1403), ('返', 1404), ('抓', 1405), ('淡', 1406), ('帽', 1407), ('皇', 1408), ('饭', 1409), ('艾', 1410), ('链', 1411), ('纸', 1412), ('摩', 1413), ('拆', 1414), (']', 1415), ('敏', 1416), ('亦', 1417), ('毒', 1418), ('汽', 1419), ('渠', 1420), ('援', 1421), ('姜', 1422), ('芬', 1423), ('诞', 1424), ('敢', 1425), ('甜', 1426), ('伙', 1427), ('轨', 1428), ('敦', 1429), ('曝', 1430), ('庄', 1431), ('凡', 1432), ('陷', 1433), ('恢', 1434), ('欣', 1435), ('[', 1436), ('拓', 1437), ('殊', 1438), ('添', 1439), ('誉', 1440), ('咨', 1441), ('壁', 1442), ('拜', 1443), ('荷', 1444), ('县', 1445), ('宫', 1446), ('径', 1447), ('蒙', 1448), ('驻', 1449), ('疯', 1450), ('尝', 1451), ('泡', 1452), ('荐', 1453), ('跨', 1454), ('炒', 1455), ('麻', 1456), ('帕', 1457), ('携', 1458), ('辑', 1459), ('屏', 1460), ('乏', 1461), ('缘', 1462), ('尊', 1463), ('彻', 1464), ('邦', 1465), ('督', 1466), ('蔡', 1467), ('贺', 1468), ('虚', 1469), ('浮', 1470), ('拼', 1471), ('劲', 1472), ('贾', 1473), ('虎', 1474), ('盈', 1475), ('卷', 1476), ('★', 1477), ('扰', 1478), ('祖', 1479), ('柔', 1480), ('偿', 1481), ('妙', 1482), ('硕', 1483), ('Z', 1484), ('闪', 1485), ('兑', 1486), ('兼', 1487), ('扎', 1488), ('郑', 1489), ('黎', 1490), ('鉴', 1491), ('侧', 1492), ('墅', 1493), ('挺', 1494), ('惯', 1495), ('艳', 1496), ('盗', 1497), ('忙', 1498), ('寸', 1499), ('尾', 1500), ('菜', 1501), ('孤', 1502), ('押', 1503), ('床', 1504), ('忘', 1505), ('痛', 1506), ('赏', 1507), ('惜', 1508), ('聊', 1509), ('逊', 1510), ('唱', 1511), ('尺', 1512), ('墨', 1513), ('柏', 1514), ('摇', 1515), ('漂', 1516), ('刊', 1517), ('偶', 1518), ('忆', 1519), ('刀', 1520), ('兄', 1521), ('捕', 1522), ('祝', 1523), ('慎', 1524), ('邓', 1525), ('柜', 1526), ('耶', 1527), ('沟', 1528), ('欲', 1529), ('胞', 1530), ('诸', 1531), ('鸟', 1532), ('患', 1533), ('敬', 1534), ('刷', 1535), ('赚', 1536), ('鹏', 1537), ('姓', 1538), ('迫', 1539), ('紫', 1540), ('迁', 1541), ('抽', 1542), ('宿', 1543), ('妻', 1544), ('矿', 1545), ('颇', 1546), ('鹿', 1547), ('氛', 1548), ('妇', 1549), ('抱', 1550), ('拒', 1551), ('隔', 1552), ('瓦', 1553), ('塑', 1554), ('羊', 1555), ('泛', 1556), ('慧', 1557), ('籍', 1558), ('绕', 1559), ('窗', 1560), ('孔', 1561), ('址', 1562), ('仿', 1563), ('伍', 1564), ('狼', 1565), ('佩', 1566), ('肩', 1567), ('~', 1568), ('冒', 1569), ('灭', 1570), ('忧', 1571), ('衬', 1572), ('稿', 1573), ('耳', 1574), ('谷', 1575), ('酷', 1576), ('递', 1577), ('阅', 1578), ('胀', 1579), ('杭', 1580), ('翰', 1581), ('篇', 1582), ('蕾', 1583), ('霆', 1584), ('汤', 1585), ('尖', 1586), ('娜', 1587), ('恰', 1588), ('袋', 1589), ('淑', 1590), ('覆', 1591), ('倾', 1592), ('描', 1593), ('览', 1594), ('迟', 1595), ('魅', 1596), ('蛋', 1597), ('宋', 1598), ('葛', 1599), ('残', 1600), ('烟', 1601), ('振', 1602), ('钻', 1603), ('番', 1604), ('贯', 1605), ('喷', 1606), ('靴', 1607), ('氏', 1608), ('沈', 1609), ('炸', 1610), ('奶', 1611), ('舍', 1612), ('铺', 1613), ('芳', 1614), ('杯', 1615), ('箱', 1616), ('寒', 1617), ('赖', 1618), ('谨', 1619), ('君', 1620), ('颁', 1621), ('诗', 1622), ('玛', 1623), ('蜂', 1624), ('赠', 1625), ('宠', 1626), ('桑', 1627), ('薄', 1628), ('潘', 1629), ('忽', 1630), ('液', 1631), ('俗', 1632), ('锁', 1633), ('浓', 1634), ('碰', 1635), ('俱', 1636), ('逃', 1637), ('披', 1638), ('懂', 1639), ('寄', 1640), ('燃', 1641), ('坞', 1642), ('沿', 1643), ('袭', 1644), ('奈', 1645), ('允', 1646), ('鹰', 1647), ('曹', 1648), ('骗', 1649), ('横', 1650), ('奢', 1651), ('寓', 1652), ('荡', 1653), ('抛', 1654), ('畅', 1655), ('爵', 1656), ('毁', 1657), ('乘', 1658), ('戈', 1659), ('稍', 1660), ('甘', 1661), ('阻', 1662), ('燕', 1663), ('捷', 1664), ('耗', 1665), ('甄', 1666), ('鬼', 1667), ('涯', 1668), ('墓', 1669), ('壮', 1670), ('赎', 1671), ('爸', 1672), ('虫', 1673), ('旁', 1674), ('阴', 1675), ('惑', 1676), ('耐', 1677), ('御', 1678), ('宙', 1679), ('遥', 1680), ('耀', 1681), ('逆', 1682), ('玲', 1683), ('刑', 1684), ('拖', 1685), ('鸡', 1686), ('沪', 1687), ('仁', 1688), ('偷', 1689), ('岩', 1690), ('池', 1691), ('魂', 1692), ('幽', 1693), ('厦', 1694), ('睡', 1695), ('绪', 1696), ('凌', 1697), ('剪', 1698), ('镑', 1699), ('踪', 1700), ('盾', 1701), ('奏', 1702), ('艰', 1703), ('悲', 1704), ('乌', 1705), ('浙', 1706), ('悬', 1707), ('旋', 1708), ('芝', 1709), ('卢', 1710), ('肖', 1711), ('稀', 1712), ('污', 1713), ('缴', 1714), ('堪', 1715), ('拔', 1716), ('袖', 1717), ('堆', 1718), ('裂', 1719), ('杉', 1720), ('厨', 1721), ('侵', 1722), ('聘', 1723), ('碎', 1724), ('胆', 1725), ('磨', 1726), ('役', 1727), ('译', 1728), ('洪', 1729), ('烦', 1730), ('妹', 1731), ('怡', 1732), ('捧', 1733), ('狗', 1734), ('忠', 1735), ('挡', 1736), ('尘', 1737), ('唤', 1738), ('肥', 1739), ('卧', 1740), ('嫌', 1741), ('赤', 1742), ('饮', 1743), ('嘴', 1744), ('辆', 1745), ('闹', 1746), ('浦', 1747), ('j', 1748), ('阔', 1749), ('猎', 1750), ('昌', 1751), ('浩', 1752), ('撑', 1753), ('沫', 1754), ('娘', 1755), ('逼', 1756), ('谭', 1757), ('症', 1758), ('夹', 1759), ('伏', 1760), ('驾', 1761), ('疾', 1762), ('貌', 1763), ('棒', 1764), ('粒', 1765), ('孟', 1766), ('乳', 1767), ('砍', 1768), ('矶', 1769), ('羽', 1770), ('鼠', 1771), ('猪', 1772), ('栋', 1773), ('绎', 1774), ('粗', 1775), ('腾', 1776), ('忍', 1777), ('昆', 1778), ('涵', 1779), ('爽', 1780), ('泉', 1781), ('郎', 1782), ('绘', 1783), ('桌', 1784), ('彼', 1785), ('碧', 1786), ('尸', 1787), ('浴', 1788), ('搬', 1789), ('喝', 1790), ('凤', 1791), ('×', 1792), ('纠', 1793), ('诱', 1794), ('践', 1795), ('惨', 1796), ('踏', 1797), ('坤', 1798), ('昂', 1799), ('悦', 1800), ('挖', 1801), ('泥', 1802), ('谊', 1803), ('肤', 1804), ('奔', 1805), ('碳', 1806), ('烧', 1807), ('谐', 1808), ('瓶', 1809), ('井', 1810), ('莉', 1811), ('俊', 1812), ('哦', 1813), ('妮', 1814), ('犹', 1815), ('巾', 1816), ('庞', 1817), ('宴', 1818), ('睛', 1819), ('幼', 1820), ('&', 1821), ('妆', 1822), ('契', 1823), ('舰', 1824), ('矛', 1825), ('铭', 1826), ('扫', 1827), ('陪', 1828), ('壳', 1829), ('弄', 1830), ('浅', 1831), ('酬', 1832), ('徒', 1833), ('填', 1834), ('*', 1835), ('兹', 1836), ('摸', 1837), ('夸', 1838), ('拨', 1839), ('炼', 1840), ('抑', 1841), ('愈', 1842), ('琼', 1843), ('晰', 1844), ('伸', 1845), ('梯', 1846), ('茂', 1847), ('烂', 1848), ('堡', 1849), ('驰', 1850), ('戒', 1851), ('捐', 1852), ('-', 1853), ('孝', 1854), ('碑', 1855), ('溢', 1856), ('吨', 1857), ('裕', 1858), ('猜', 1859), ('废', 1860), ('赔', 1861), ('磁', 1862), ('煤', 1863), ('吊', 1864), ('琴', 1865), ('旬', 1866), ('掩', 1867), ('纵', 1868), ('姿', 1869), ('菌', 1870), ('碍', 1871), ('怒', 1872), ('秦', 1873), ('怖', 1874), ('串', 1875), ('恤', 1876), ('氧', 1877), ('纺', 1878), ('辨', 1879), ('勤', 1880), ('袜', 1881), ('疫', 1882), ('乃', 1883), ('粮', 1884), ('邻', 1885), ('旺', 1886), ('吹', 1887), ('柯', 1888), ('循', 1889), ('琳', 1890), ('勃', 1891), ('瞬', 1892), ('爷', 1893), ('脉', 1894), ('叹', 1895), ('赋', 1896), ('淘', 1897), ('薇', 1898), ('漏', 1899), ('陶', 1900), ('页', 1901), ('蒋', 1902), ('辈', 1903), ('蓄', 1904), ('毅', 1905), ('雇', 1906), ('欠', 1907), ('牵', 1908), ('巡', 1909), ('插', 1910), ('奕', 1911), ('岗', 1912), ('娃', 1913), ('剂', 1914), ('桂', 1915), ('鸿', 1916), ('崇', 1917), ('暑', 1918), ('挤', 1919), ('郁', 1920), ('赌', 1921), ('胁', 1922), ('茶', 1923), ('膝', 1924), ('涌', 1925), ('廷', 1926), ('憾', 1927), ('鸣', 1928), ('雕', 1929), ('莎', 1930), ('凉', 1931), ('酸', 1932), ('贤', 1933), ('辞', 1934), ('滚', 1935), ('蝶', 1936), ('槛', 1937), ('啦', 1938), ('渡', 1939), ('锐', 1940), ('拳', 1941), ('玻', 1942), ('赫', 1943), ('翼', 1944), ('茨', 1945), ('厉', 1946), ('攀', 1947), ('•', 1948), ('颖', 1949), ('娇', 1950), ('翔', 1951), ('蛙', 1952), ('蜜', 1953), ('牢', 1954), ('桃', 1955), ('杆', 1956), ('斑', 1957), ('裸', 1958), ('驱', 1959), ('撤', 1960), ('朵', 1961), ('匹', 1962), ('瓜', 1963), ('辅', 1964), ('枚', 1965), ('械', 1966), ('妖', 1967), ('厘', 1968), ('晋', 1969), ('炮', 1970), ('瘦', 1971), ('璃', 1972), ('哭', 1973), ('飘', 1974), ('伪', 1975), ('侨', 1976), ('框', 1977), ('逾', 1978), ('翠', 1979), ('栏', 1980), ('胶', 1981), ('驶', 1982), ('苑', 1983), ('埋', 1984), ('扶', 1985), ('绒', 1986), ('垃', 1987), ('淇', 1988), ('坑', 1989), ('圾', 1990), ('寿', 1991), ('糕', 1992), ('罕', 1993), ('彭', 1994), ('扭', 1995), ('绑', 1996), ('苗', 1997), ('捉', 1998), ('吕', 1999), ('谱', 2000), ('穷', 2001), ('婴', 2002), ('屡', 2003), ('飙', 2004), ('聪', 2005), ('兆', 2006), ('慈', 2007), ('勿', 2008), ('卓', 2009), ('臣', 2010), ('衰', 2011), ('瓷', 2012), ('赁', 2013), ('腐', 2014), ('弥', 2015), ('斤', 2016), ('=', 2017), ('叠', 2018), ('奉', 2019), ('豆', 2020), ('荒', 2021), ('涂', 2022), ('纱', 2023), ('冻', 2024), ('睐', 2025), ('郊', 2026), ('滩', 2027), ('仇', 2028), ('鼎', 2029), ('祥', 2030), ('轰', 2031), ('盲', 2032), ('~', 2033), ('衷', 2034), ('滞', 2035), ('悠', 2036), ('怨', 2037), ('毯', 2038), ('贫', 2039), ('陨', 2040), ('琪', 2041), ('蛇', 2042), ('肃', 2043), ('泪', 2044), ('臂', 2045), ('侣', 2046), ('莲', 2047), ('陵', 2048), ('垫', 2049), ('猩', 2050), ('椅', 2051), ('劫', 2052), ('皆', 2053), ('尬', 2054), ('脏', 2055), ('尴', 2056), ('丢', 2057), ('铜', 2058), ('靓', 2059), ('盐', 2060), ('傲', 2061), ('彦', 2062), ('膨', 2063), ('旨', 2064), ('婆', 2065), ('辐', 2066), ('贬', 2067), ('疲', 2068), ('艇', 2069), ('棉', 2070), ('泄', 2071), ('妥', 2072), ('滨', 2073), ('胎', 2074), ('喊', 2075), ('柱', 2076), ('擎', 2077), ('翁', 2078), ('狱', 2079), ('馨', 2080), ('魏', 2081), ('糟', 2082), ('腕', 2083), ('悄', 2084), ('妨', 2085), ('砖', 2086), ('履', 2087), ('哲', 2088), ('_', 2089), ('谜', 2090), ('虹', 2091), ('吻', 2092), ('炉', 2093), ('纲', 2094), ('竹', 2095), ('劣', 2096), ('闷', 2097), ('纤', 2098), ('泳', 2099), ('咱', 2100), ('漆', 2101), ('凸', 2102), ('夕', 2103), ('脆', 2104), ('俩', 2105), ('饱', 2106), ('贪', 2107), ('藤', 2108), ('亩', 2109), ('猴', 2110), ('辽', 2111), ('漠', 2112), ('塌', 2113), ('丧', 2114), ('疆', 2115), ('孕', 2116), ('轩', 2117), ('q', 2118), ('玄', 2119), ('斌', 2120), ('擅', 2121), ('僵', 2122), ('汗', 2123), ('挣', 2124), ('峡', 2125), ('袁', 2126), ('衔', 2127), ('弊', 2128), ('凶', 2129), ('痕', 2130), ('巩', 2131), ('邪', 2132), ('勾', 2133), ('寺', 2134), ('朴', 2135), ('迄', 2136), ('侈', 2137), ('呆', 2138), ('抄', 2139), ('豹', 2140), ('掀', 2141), ('斥', 2142), ('彬', 2143), ('躲', 2144), ('裔', 2145), ('罩', 2146), ('辣', 2147), ('盒', 2148), ('啸', 2149), ('莞', 2150), ('丈', 2151), ('钩', 2152), ('肌', 2153), ('炎', 2154), ('缝', 2155), ('糊', 2156), ('狄', 2157), ('帆', 2158), ('橱', 2159), ('倡', 2160), ('媚', 2161), ('笼', 2162), ('凝', 2163), ('磊', 2164), ('慰', 2165), ('渔', 2166), ('割', 2167), ('逢', 2168), ('诈', 2169), ('舟', 2170), ('盼', 2171), ('辩', 2172), ('旭', 2173), ('摊', 2174), ('吓', 2175), ('诊', 2176), ('抬', 2177), ('!', 2178), ('魁', 2179), ('垂', 2180), ('逸', 2181), ('髦', 2182), ('彰', 2183), ('艘', 2184), ('屹', 2185), ('轴', 2186), ('蛮', 2187), ('遵', 2188), ('吁', 2189), ('斜', 2190), ('催', 2191), ('姑', 2192), ("'", 2193), ('姻', 2194), ('渤', 2195), ('狮', 2196), ('滋', 2197), ('馈', 2198), ('爬', 2199), ('咖', 2200), ('狠', 2201), ('霞', 2202), ('匪', 2203), ('撼', 2204), ('挫', 2205), ('恨', 2206), ('遮', 2207), ('泼', 2208), ('缀', 2209), ('腻', 2210), ('颠', 2211), ('胖', 2212), ('淀', 2213), ('柳', 2214), ('坠', 2215), ('骂', 2216), ('韵', 2217), ('鲨', 2218), ('湿', 2219), ('耕', 2220), ('敲', 2221), ('撰', 2222), ('啡', 2223), ('翡', 2224), ('穴', 2225), ('扇', 2226), ('疼', 2227), ('蝠', 2228), ('蛛', 2229), ('俏', 2230), ('醉', 2231), ('糖', 2232), ('煌', 2233), ('鲸', 2234), ('锡', 2235), ('渴', 2236), ('惧', 2237), ('愤', 2238), ('擦', 2239), ('窄', 2240), ('玫', 2241), ('峻', 2242), ('慕', 2243), ('削', 2244), ('抖', 2245), ('舱', 2246), ('抹', 2247), ('腊', 2248), ('摘', 2249), ('炫', 2250), ('楠', 2251), ('歧', 2252), ('帖', 2253), ('熙', 2254), ('穆', 2255), ('寨', 2256), ('捂', 2257), ('丑', 2258), ('兔', 2259), ('殖', 2260), ('慌', 2261), ('眠', 2262), ('嘛', 2263), ('帐', 2264), ('锻', 2265), ('坎', 2266), ('筐', 2267), ('粹', 2268), ('窃', 2269), ('钉', 2270), ('囊', 2271), ('汶', 2272), ('侯', 2273), ('●', 2274), ('羁', 2275), ('戛', 2276), ('□', 2277), ('仰', 2278), ('忌', 2279), ('歇', 2280), ('滴', 2281), ('芯', 2282), ('瘾', 2283), ('蝴', 2284), ('伐', 2285), ('趁', 2286), ('皱', 2287), ('欺', 2288), ('衍', 2289), ('/', 2290), ('溪', 2291), ('逛', 2292), ('吞', 2293), ('悚', 2294), ('蝙', 2295), ('揽', 2296), ('扑', 2297), ('崩', 2298), ('枝', 2299), ('缠', 2300), ('哨', 2301), ('勘', 2302), ('砸', 2303), ('堵', 2304), ('诠', 2305), ('鼻', 2306), ('珊', 2307), ('瑜', 2308), ('寂', 2309), ('帘', 2310), ('钞', 2311), ('烨', 2312), ('倩', 2313), ('昔', 2314), ('磅', 2315), ('瑟', 2316), ('骤', 2317), ('嫁', 2318), ('挪', 2319), ('贿', 2320), ('眉', 2321), ('凰', 2322), ('淋', 2323), ('鲍', 2324), ('俐', 2325), ('鹅', 2326), ('佣', 2327), ('腹', 2328), ('蓬', 2329), ('锤', 2330), ('廊', 2331), ('骄', 2332), ('悟', 2333), ('屈', 2334), ('呵', 2335), ('删', 2336), ('吐', 2337), ('盆', 2338), ('凳', 2339), ('搏', 2340), ('萎', 2341), ('恼', 2342), ('傅', 2343), ('陌', 2344), ('汪', 2345), ('愉', 2346), ('裹', 2347), ('瞩', 2348), (';', 2349), ('褶', 2350), ('巫', 2351), ('贼', 2352), ('坊', 2353), ('茅', 2354), ('撒', 2355), ('邱', 2356), ('@', 2357), ('雾', 2358), ('筒', 2359), ('咬', 2360), ('齿', 2361), ('矮', 2362), ('斩', 2363), ('鑫', 2364), ('璇', 2365), ('锅', 2366), ('樟', 2367), ('拐', 2368), ('函', 2369), ('逻', 2370), ('喻', 2371), ('苹', 2372), ('婷', 2373), ('瑰', 2374), ('旱', 2375), ('仲', 2376), ('慨', 2377), ('惹', 2378), ('■', 2379), ('窝', 2380), ('悍', 2381), ('讶', 2382), ('悔', 2383), ('膀', 2384), ('晃', 2385), ('颈', 2386), ('凑', 2387), ('讼', 2388), ('亨', 2389), ('葬', 2390), ('睹', 2391), ('叔', 2392), ('崔', 2393), ('蔓', 2394), ('弯', 2395), ('豫', 2396), ('歉', 2397), ('舆', 2398), ('闯', 2399), ('肿', 2400), ('仕', 2401), ('勋', 2402), ('牲', 2403), ('厌', 2404), ('踝', 2405), ('辰', 2406), ('宪', 2407), ('莹', 2408), ('萧', 2409), ('徽', 2410), ('雀', 2411), ('酿', 2412), ('咏', 2413), ('罢', 2414), ('癌', 2415), ('叛', 2416), ('巢', 2417), ('媛', 2418), ('膜', 2419), ('岳', 2420), ('滥', 2421), ('萍', 2422), ('屠', 2423), ('洒', 2424), ('闫', 2425), ('壤', 2426), ('冕', 2427), ('骚', 2428), ('灌', 2429), ('牧', 2430), ('蜘', 2431), ('橙', 2432), ('肢', 2433), ('垄', 2434), ('弘', 2435), ('牺', 2436), ('嫩', 2437), ('蹈', 2438), ('龟', 2439), ('肚', 2440), ('炭', 2441), ('汰', 2442), ('芒', 2443), ('傻', 2444), ('阁', 2445), ('桶', 2446), ('螺', 2447), ('壶', 2448), ('绮', 2449), ('胺', 2450), ('黛', 2451), ('#', 2452), ('晕', 2453), ('臀', 2454), ('绵', 2455), ('郡', 2456), ('泊', 2457), ('陕', 2458), ('脂', 2459), ('葡', 2460), ('蔚', 2461), ('秩', 2462), ('粤', 2463), ('秉', 2464), ('抚', 2465), ('婉', 2466), ('雯', 2467), ('睿', 2468), ('奠', 2469), ('羡', 2470), ('驳', 2471), ('囤', 2472), ('蚁', 2473), ('肆', 2474), ('疏', 2475), ('鳄', 2476), ('殿', 2477), ('逝', 2478), ('廖', 2479), ('洽', 2480), ('谦', 2481), ('钓', 2482), ('棚', 2483), ('挽', 2484), ('棕', 2485), ('卵', 2486), ('豚', 2487), ('顽', 2488), ('薛', 2489), ('沸', 2490), ('澄', 2491), ('拘', 2492), ('谍', 2493), ('禽', 2494), ('氢', 2495), ('辟', 2496), ('邵', 2497), ('苍', 2498), ('劝', 2499), ('剔', 2500), ('砂', 2501), ('舌', 2502), ('郝', 2503), ('丛', 2504), ('萄', 2505), ('%', 2506), ('懒', 2507), ('晤', 2508), ('啥', 2509), ('蒸', 2510), ('伞', 2511), ('湘', 2512), ('茫', 2513), ('拾', 2514), ('盯', 2515), ('尹', 2516), ('辖', 2517), ('蕴', 2518), ('溃', 2519), ('邹', 2520), ('禅', 2521), ('仗', 2522), ('晒', 2523), ('杠', 2524), ('佐', 2525), ('萌', 2526), ('奎', 2527), ('匆', 2528), ('娥', 2529), ('氰', 2530), ('夷', 2531), ('棋', 2532), ('拯', 2533), ('耍', 2534), ('冈', 2535), ('绸', 2536), ('厕', 2537), ('倪', 2538), ('翟', 2539), ('瞄', 2540), ('筋', 2541), ('碗', 2542), ('庸', 2543), ('祸', 2544), ('岭', 2545), ('暨', 2546), ('诀', 2547), ('竣', 2548), ('巅', 2549), ('麟', 2550), ('栖', 2551), ('丙', 2552), ('⊙', 2553), ('扔', 2554), ('镶', 2555), ('遣', 2556), ('楂', 2557), ('呀', 2558), ('俪', 2559), ('羞', 2560), ('祭', 2561), ('妩', 2562), ('澜', 2563), ('痴', 2564), ('浏', 2565), ('烛', 2566), ('仑', 2567), ('彗', 2568), ('袍', 2569), ('姬', 2570), ('焰', 2571), ('廓', 2572), ('绣', 2573), ('翅', 2574), ('辱', 2575), ('叙', 2576), ('蓉', 2577), ('刃', 2578), ('乾', 2579), ('戚', 2580), ('怜', 2581), ('阐', 2582), ('辜', 2583), ('雌', 2584), ('辕', 2585), ('臭', 2586), ('狐', 2587), ('渣', 2588), ('敞', 2589), ('荧', 2590), ('脖', 2591), ('帷', 2592), ('甩', 2593), ('胃', 2594), ('搁', 2595), ('瞻', 2596), ('晴', 2597), ('顷', 2598), ('聂', 2599), ('乙', 2600), ('饼', 2601), ('丘', 2602), ('惩', 2603), ('琦', 2604), ('梨', 2605), ('璐', 2606), ('侃', 2607), ('愁', 2608), ('柴', 2609), ('绚', 2610), ('魄', 2611), ('噪', 2612), ('犀', 2613), ('弈', 2614), ('崛', 2615), ('扯', 2616), ('灿', 2617), ('溯', 2618), ('躺', 2619), ('踢', 2620), ('◆', 2621), ('踩', 2622), ('恭', 2623), ('狭', 2624), ('乖', 2625), ('稻', 2626), ('潭', 2627), ('槽', 2628), ('惕', 2629), ('磋', 2630), ('靡', 2631), ('巷', 2632), ('暮', 2633), ('虐', 2634), ('粘', 2635), ('遏', 2636), ('$', 2637), ('铅', 2638), ('浸', 2639), ('绳', 2640), ('刮', 2641), ('愚', 2642), ('炜', 2643), ('镁', 2644), ('勉', 2645), ('哀', 2646), ('逗', 2647), ('酝', 2648), ('芭', 2649), ('沧', 2650), ('浑', 2651), ('畔', 2652), ('嵌', 2653), ('掏', 2654), ('匠', 2655), ('饲', 2656), ('懈', 2657), ('愧', 2658), ('兜', 2659), ('钗', 2660), ('嫦', 2661), ('咒', 2662), ('屿', 2663), ('叉', 2664), ('骸', 2665), ('渊', 2666), ('绯', 2667), ('躁', 2668), ('霖', 2669), ('漓', 2670), ('匙', 2671), ('昏', 2672), ('弧', 2673), ('蠢', 2674), ('阱', 2675), ('卜', 2676), ('鸭', 2677), ('脊', 2678), ('渗', 2679), ('庙', 2680), ('韧', 2681), ('屁', 2682), ('浆', 2683), ('肺', 2684), ('鸦', 2685), ('熔', 2686), ('拦', 2687), ('肠', 2688), ('摔', 2689), ('惟', 2690), ('郅', 2691), ('絮', 2692), ('碌', 2693), ('渝', 2694), ('é', 2695), ('幢', 2696), ('卸', 2697), ('伽', 2698), ('嘘', 2699), ('擂', 2700), ('腔', 2701), ('龚', 2702), ('烤', 2703), ('婧', 2704), ('矩', 2705), ('纶', 2706), ('硅', 2707), ('诡', 2708), ('昭', 2709), ('霜', 2710), ('娟', 2711), ('翘', 2712), ('摧', 2713), ('冉', 2714), ('燥', 2715), ('碟', 2716), ('篪', 2717), ('汁', 2718), ('玺', 2719), ('犸', 2720), ('甸', 2721), ('窦', 2722), ('晖', 2723), ('铝', 2724), ('蚀', 2725), ('剖', 2726), ('胚', 2727), ('崖', 2728), ('熬', 2729), ('朔', 2730), ('闵', 2731), ('掠', 2732), ('畏', 2733), ('缅', 2734), ('隅', 2735), ('贩', 2736), ('匿', 2737), ('钥', 2738), ('琢', 2739), ('谅', 2740), ('讽', 2741), ('圻', 2742), ('榄', 2743), ('誓', 2744), ('刹', 2745), ('谣', 2746), ('厄', 2747), ('萝', 2748), ('焕', 2749), ('骼', 2750), ('寞', 2751), ('寥', 2752), ('缎', 2753), ('沦', 2754), ('拷', 2755), ('挨', 2756), ('塘', 2757), ('澡', 2758), ('亥', 2759), ('枯', 2760), ('吵', 2761), ('僧', 2762), ('橘', 2763), ('栈', 2764), ('竭', 2765), ('捡', 2766), ('髓', 2767), ('谎', 2768), ('蔬', 2769), ('钮', 2770), ('橄', 2771), ('溜', 2772), ('撕', 2773), ('睁', 2774), ('沾', 2775), ('茵', 2776), ('缤', 2777), ('拇', 2778), ('罐', 2779), ('寰', 2780), ('佼', 2781), ('竖', 2782), ('屯', 2783), ('殷', 2784), ('崭', 2785), ('潇', 2786), ('犬', 2787), ('纬', 2788), ('.', 2789), ('讳', 2790), ('捞', 2791), ('筛', 2792), ('绽', 2793), ('捏', 2794), ('鞍', 2795), ('琐', 2796), ('卉', 2797), ('枫', 2798), ('涩', 2799), ('铃', 2800), ('唇', 2801), ('肝', 2802), ('腥', 2803), ('沛', 2804), ('瑶', 2805), ('卿', 2806), ('敛', 2807), ('扛', 2808), ('妍', 2809), ('嘲', 2810), ('弓', 2811), ('☆', 2812), ('坪', 2813), ('窍', 2814), ('觅', 2815), ('奴', 2816), ('凹', 2817), ('缔', 2818), ('佟', 2819), ('蔽', 2820), ('闸', 2821), ('扳', 2822), ('梳', 2823), ('冤', 2824), ('蚂', 2825), ('骏', 2826), ('爪', 2827), ('哄', 2828), ('丸', 2829), ('喂', 2830), ('镖', 2831), ('柄', 2832), ('湛', 2833), ('篷', 2834), ('娄', 2835), ('逮', 2836), ('蜥', 2837), ('盎', 2838), ('剥', 2839), ('缪', 2840), ('鹤', 2841), ('蟹', 2842), ('帜', 2843), ('傍', 2844), ('徊', 2845), ('枕', 2846), ('瀑', 2847), ('徘', 2848), ('俞', 2849), ('阮', 2850), ('炙', 2851), ('芙', 2852), ('哺', 2853), ('靖', 2854), ('挚', 2855), ('袂', 2856), ('炬', 2857), ('肪', 2858), ('硫', 2859), ('汀', 2860), ('禾', 2861), ('珀', 2862), ('钧', 2863), ('彪', 2864), ('肇', 2865), ('烹', 2866), ('噩', 2867), ('隙', 2868), ('桩', 2869), ('锈', 2870), ('礁', 2871), ('嚣', 2872), ('尿', 2873), ('垒', 2874), ('襟', 2875), ('+', 2876), ('攒', 2877), ('噬', 2878), ('苛', 2879), ('吼', 2880), ('棍', 2881), ('煞', 2882), ('迭', 2883), ('笨', 2884), ('暇', 2885), ('拢', 2886), ('涡', 2887), ('肘', 2888), ('宰', 2889), ('诛', 2890), ('喇', 2891), ('俭', 2892), ('→', 2893), ('钦', 2894), ('菊', 2895), ('藉', 2896), ('卑', 2897), ('坝', 2898), ('樊', 2899), ('铆', 2900), ('亭', 2901), ('锂', 2902), ('咕', 2903), ('虞', 2904), ('俯', 2905), ('斧', 2906), ('盔', 2907), ('棵', 2908), ('铸', 2909), ('饿', 2910), ('掷', 2911), ('彤', 2912), ('瞒', 2913), ('梭', 2914), ('淮', 2915), ('汹', 2916), ('卦', 2917), ('锣', 2918), ('辙', 2919), ('宵', 2920), ('濒', 2921), ('蜡', 2922), ('褐', 2923), ('耻', 2924), ('乍', 2925), ('咸', 2926), ('橡', 2927), ('缸', 2928), ('乞', 2929), ('垮', 2930), ('膏', 2931), ('鄂', 2932), ('弦', 2933), ('霉', 2934), ('倦', 2935), ('畴', 2936), ('虾', 2937), ('隧', 2938), ('荫', 2939), ('绅', 2940), ('冥', 2941), ('昧', 2942), ('荆', 2943), ('媳', 2944), ('瘤', 2945), ('浇', 2946), ('昊', 2947), ('嫂', 2948), ('遂', 2949), ('烫', 2950), ('赘', 2951), ('跻', 2952), ('烷', 2953), ('藻', 2954), ('酱', 2955), ('俨', 2956), ('驼', 2957), ('庚', 2958), ('糙', 2959), ('饥', 2960), ('曙', 2961), ('煮', 2962), ('辄', 2963), ('狙', 2964), ('茜', 2965), ('咋', 2966), ('佑', 2967), ('舶', 2968), ('趟', 2969), ('冀', 2970), ('钾', 2971), ('拱', 2972), ('腺', 2973), ('滤', 2974), ('妃', 2975), ('祈', 2976), ('骁', 2977), ('骷', 2978), ('斐', 2979), ('麒', 2980), ('颓', 2981), ('脾', 2982), ('髅', 2983), ('覃', 2984), ('熠', 2985), ('镂', 2986), ('儒', 2987), ('霄', 2988), ('哑', 2989), ('枢', 2990), ('噱', 2991), ('陋', 2992), ('冶', 2993), ('贞', 2994), ('圃', 2995), ('涅', 2996), ('耽', 2997), ('蒲', 2998), ('窥', 2999), ('喘', 3000), ('杖', 3001), ('隽', 3002), ('姨', 3003), ('哒', 3004), ('裴', 3005), ('|', 3006), ('岚', 3007), ('饶', 3008), ('搅', 3009), ('玮', 3010), ('埔', 3011), ('渲', 3012), ('熏', 3013), ('琛', 3014), ('○', 3015), ('─', 3016), ('喧', 3017), ('踊', 3018), ('℃', 3019), ('<', 3020), ('肋', 3021), ('拭', 3022), ('耿', 3023), ('厢', 3024), ('邢', 3025), ('捆', 3026), ('镯', 3027), ('峥', 3028), ('株', 3029), ('哇', 3030), ('譬', 3031), ('隶', 3032), ('璨', 3033), ('屑', 3034), ('嫣', 3035), ('葆', 3036), ('绰', 3037), ('沮', 3038), ('孵', 3039), ('歪', 3040), ('淹', 3041), ('揣', 3042), ('淳', 3043), ('奸', 3044), ('帧', 3045), ('瑚', 3046), ('宛', 3047), ('酶', 3048), ('陡', 3049), ('嗅', 3050), ('毋', 3051), ('嘿', 3052), ('啤', 3053), ('淫', 3054), ('臃', 3055), ('墟', 3056), ('砚', 3057), ('稽', 3058), ('缚', 3059), ('璀', 3060), ('锯', 3061), ('嬉', 3062), ('栽', 3063), ('茄', 3064), ('佬', 3065), ('Ⅱ', 3066), ('娅', 3067), ('畜', 3068), ('樱', 3069), ('氨', 3070), ('翩', 3071), ('倘', 3072), ('曦', 3073), ('瞧', 3074), ('暧', 3075), ('鳌', 3076), ('镀', 3077), ('桦', 3078), ('黯', 3079), ('寡', 3080), ('蚊', 3081), ('葱', 3082), ('惫', 3083), ('幂', 3084), ('烘', 3085), ('惬', 3086), ('抉', 3087), ('椎', 3088), ('飓', 3089), ('媲', 3090), ('溶', 3091), ('昕', 3092), ('妤', 3093), ('沼', 3094), ('闺', 3095), ('轶', 3096), ('滕', 3097), ('煎', 3098), ('饪', 3099), ('耸', 3100), ('聆', 3101), ('$', 3102), ('氮', 3103), ('蜀', 3104), ('庐', 3105), ('罄', 3106), ('菁', 3107), ('窘', 3108), ('姗', 3109), ('鲲', 3110), ('醋', 3111), ('窟', 3112), ('岂', 3113), ('棺', 3114), ('灶', 3115), ('雍', 3116), ('禧', 3117), ('赐', 3118), ('晟', 3119), ('瞎', 3120), ('艋', 3121), ('珂', 3122), ('釉', 3123), ('痒', 3124), ('缉', 3125), ('缆', 3126), ('窑', 3127), ('岐', 3128), ('柬', 3129), ('膊', 3130), ('狸', 3131), ('猿', 3132), ('琅', 3133), ('匀', 3134), ('迥', 3135), ('牟', 3136), ('嘟', 3137), ('爹', 3138), ('蜗', 3139), ('婕', 3140), ('骥', 3141), ('蹄', 3142), ('菱', 3143), ('骆', 3144), ('恳', 3145), ('拎', 3146), ('渺', 3147), ('炯', 3148), ('茹', 3149), ('赂', 3150), ('诟', 3151), ('哗', 3152), ('炳', 3153), ('笛', 3154), ('趾', 3155), ('∶', 3156), ('颐', 3157), ('歼', 3158), ('蝉', 3159), ('芦', 3160), ('泣', 3161), ('陀', 3162), ('堕', 3163), ('畸', 3164), ('涿', 3165), ('¥', 3166), ('硝', 3167), ('宕', 3168), ('釜', 3169), ('壹', 3170), ('玖', 3171), ('蓓', 3172), ('瑕', 3173), ('绷', 3174), ('贱', 3175), ('缭', 3176), ('豁', 3177), ('娶', 3178), ('禄', 3179), ('栗', 3180), ('伺', 3181), ('穗', 3182), ('泌', 3183), ('赝', 3184), ('膑', 3185), ('坍', 3186), ('稚', 3187), ('醛', 3188), ('叮', 3189), ('滔', 3190), ('胳', 3191), ('坟', 3192), ('凿', 3193), ('邬', 3194), ('躯', 3195), ('驭', 3196), ('瞪', 3197), ('葵', 3198), ('棱', 3199), ('瀚', 3200), ('烁', 3201), ('囚', 3202), ('溅', 3203), ('旷', 3204), ('矢', 3205), ('侍', 3206), ('榻', 3207), ('辗', 3208), ('轿', 3209), ('磷', 3210), ('憋', 3211), ('挠', 3212), ('炽', 3213), ('洼', 3214), ('阎', 3215), ('芽', 3216), ('捍', 3217), ('杏', 3218), ('诫', 3219), ('崎', 3220), ('嘱', 3221), ('劈', 3222), ('吾', 3223), ('谴', 3224), ('沐', 3225), ('梵', 3226), ('鸥', 3227), ('珑', 3228), ('檀', 3229), ('姥', 3230), ('蜴', 3231), ('鞭', 3232), ('棘', 3233), ('蜕', 3234), ('逍', 3235), ('堤', 3236), ('桐', 3237), ('惺', 3238), ('戮', 3239), ('跪', 3240), ('魑', 3241), ('嘻', 3242), ('癫', 3243), ('侏', 3244), ('沁', 3245), ('孢', 3246), ('喉', 3247), ('肾', 3248), ('瘫', 3249), ('醇', 3250), ('骇', 3251), ('喀', 3252), ('忐', 3253), ('忑', 3254), ('萃', 3255), ('栩', 3256), ('瓣', 3257), ('嗓', 3258), ('粪', 3259), ('徙', 3260), ('烯', 3261), ('榴', 3262), ('邸', 3263), ('诅', 3264), ('蹲', 3265), ('嗯', 3266), ('蕉', 3267), ('椒', 3268), ('凄', 3269), ('妞', 3270), ('芸', 3271), ('妒', 3272), ('羚', 3273), ('恍', 3274), ('朽', 3275), ('韬', 3276), ('蝇', 3277), ('剃', 3278), ('秃', 3279), ('亟', 3280), ('�', 3281), ('鄢', 3282), ('憧', 3283), ('褒', 3284), ('妄', 3285), ('牡', 3286), ('汐', 3287), ('扼', 3288), ('阀', 3289), ('呕', 3290), ('遐', 3291), ('蟒', 3292), ('铮', 3293), ('霾', 3294), ('毙', 3295), ('叭', 3296), ('簇', 3297), ('邂', 3298), ('逅', 3299), ('萱', 3300), ('吝', 3301), ('禺', 3302), ('嗜', 3303), ('酋', 3304), ('菇', 3305), ('襄', 3306), ('驯', 3307), ('蹊', 3308), ('颤', 3309), ('慑', 3310), ('祷', 3311), ('楷', 3312), ('珏', 3313), ('缇', 3314), ('拽', 3315), ('颂', 3316), ('寇', 3317), ('憬', 3318), ('飚', 3319), ('嫉', 3320), ('氯', 3321), ('灼', 3322), ('褪', 3323), ('眩', 3324), ('氦', 3325), ('螂', 3326), ('砌', 3327), ('咯', 3328), ('俑', 3329), ('悼', 3330), ('疵', 3331), ('铲', 3332), ('袱', 3333), ('枉', 3334), ('跷', 3335), ('兢', 3336), ('僚', 3337), ('澎', 3338), ('晔', 3339), ('晏', 3340), ('皓', 3341), ('匈', 3342), ('・', 3343), ('梓', 3344), ('娴', 3345), ('倚', 3346), ('弩', 3347), ('匮', 3348), ('徕', 3349), ('饽', 3350), ('汛', 3351), ('锥', 3352), ('厮', 3353), ('庇', 3354), ('荼', 3355), ('^', 3356), ('沓', 3357), ('恬', 3358), ('甫', 3359), ('匾', 3360), ('瑾', 3361), ('眷', 3362), ('孰', 3363), ('祺', 3364), ('鳞', 3365), ('孚', 3366), ('孜', 3367), ('坯', 3368), ('迦', 3369), ('拙', 3370), ('矫', 3371), ('啃', 3372), ('驴', 3373), ('饺', 3374), ('僻', 3375), ('莓', 3376), ('蘑', 3377), ('咽', 3378), ('跋', 3379), ('舵', 3380), ('煽', 3381), ('吟', 3382), ('焚', 3383), ('竿', 3384), ('绊', 3385), ('殴', 3386), ('躬', 3387), ('榆', 3388), ('陇', 3389), ('璧', 3390), ('痪', 3391), ('疤', 3392), ('槟', 3393), ('歹', 3394), ('觑', 3395), ('坷', 3396), ('呐', 3397), ('谬', 3398), ('铨', 3399), ('昱', 3400), ('茸', 3401), ('磕', 3402), ('泻', 3403), ('鞠', 3404), ('筝', 3405), ('缕', 3406), ('殆', 3407), ('簿', 3408), ('琥', 3409), ('苞', 3410), ('掐', 3411), ('兀', 3412), ('窈', 3413), ('窕', 3414), ('檐', 3415), ('熄', 3416), ('睦', 3417), ('凛', 3418), ('趴', 3419), ('盏', 3420), ('瑙', 3421), ('敷', 3422), ('摒', 3423), ('瞰', 3424), ('潢', 3425), ('栅', 3426), ('蹿', 3427), ('喔', 3428), ('佘', 3429), ('谙', 3430), ('擒', 3431), ('砥', 3432), ('抒', 3433), ('圭', 3434), ('仆', 3435), ('赃', 3436), ('碘', 3437), ('黏', 3438), ('羹', 3439), ('阪', 3440), ('舅', 3441), ('蹦', 3442), ('穹', 3443), ('婪', 3444), ('俘', 3445), ('屉', 3446), ('鳍', 3447), ('咎', 3448), ('愣', 3449), ('撇', 3450), ('叨', 3451), ('寐', 3452), ('°', 3453), ('挟', 3454), ('汲', 3455), ('笈', 3456), ('蛟', 3457), ('镍', 3458), ('惮', 3459), ('漩', 3460), ('巍', 3461), ('钙', 3462), ('堰', 3463), ('粥', 3464), ('隋', 3465), ('毗', 3466), ('骋', 3467), ('慷', 3468), ('鹊', 3469), ('煜', 3470), ('憨', 3471), ('丐', 3472), ('峨', 3473), ('烙', 3474), ('哎', 3475), ('酪', 3476), ('\\', 3477), ('惋', 3478), ('慵', 3479), ('娆', 3480), ('挎', 3481), ('棠', 3482), ('莘', 3483), ('煲', 3484), ('蚕', 3485), ('昵', 3486), ('咳', 3487), ('斋', 3488), ('寝', 3489), ('尧', 3490), ('翎', 3491), ('稠', 3492), ('捣', 3493), ('眨', 3494), ('犷', 3495), ('澈', 3496), ('稣', 3497), ('苯', 3498), ('绞', 3499), ('诧', 3500), ('雏', 3501), ('邃', 3502), ('砷', 3503), ('辫', 3504), ('裘', 3505), ('砭', 3506), ('椭', 3507), ('疟', 3508), ('篑', 3509), ('呛', 3510), ('嘎', 3511), ('涤', 3512), ('戟', 3513), ('榈', 3514), ('铐', 3515), ('岑', 3516), ('颅', 3517), ('衅', 3518), ('苟', 3519), ('筷', 3520), ('咧', 3521), ('螃', 3522), ('蚓', 3523), ('箍', 3524), ('惶', 3525), ('膺', 3526), ('呱', 3527), ('剽', 3528), ('曳', 3529), ('闽', 3530), ('泵', 3531), ('砝', 3532), ('臻', 3533), ('懵', 3534), ('戳', 3535), ('靶', 3536), ('侥', 3537), ('掺', 3538), ('沽', 3539), ('粟', 3540), ('弛', 3541), ('狡', 3542), ('峙', 3543), ('钵', 3544), ('蝎', 3545), ('昼', 3546), ('琉', 3547), ('伎', 3548), ('揪', 3549), ('迸', 3550), ('哮', 3551), ('奚', 3552), ('蛰', 3553), ('皙', 3554), ('碱', 3555), ('矜', 3556), ('戎', 3557), ('薯', 3558), ('悖', 3559), ('亢', 3560), ('垦', 3561), ('倔', 3562), ('胯', 3563), ('酣', 3564), ('窒', 3565), ('鸽', 3566), ('鹦', 3567), ('榕', 3568), ('踵', 3569), ('诵', 3570), ('姊', 3571), ('伶', 3572), ('钊', 3573), ('拧', 3574), ('哟', 3575), ('抨', 3576), ('撩', 3577), ('溉', 3578), ('酌', 3579), ('莅', 3580), ('®', 3581), ('μ', 3582), ('渎', 3583), ('峭', 3584), ('茧', 3585), ('妓', 3586), ('雁', 3587), ('◎', 3588), ('炅', 3589), ('柠', 3590), ('懿', 3591), ('酥', 3592), ('腩', 3593), ('窖', 3594), ('貂', 3595), ('舜', 3596), ('蒜', 3597), ('蚯', 3598), ('嵩', 3599), ('嚷', 3600), ('缄', 3601), ('肴', 3602), ('耘', 3603), ('麓', 3604), ('韶', 3605), ('娲', 3606), ('曜', 3607), ('诙', 3608), ('娓', 3609), ('氓', 3610), ('猬', 3611), ('敖', 3612), ('鹉', 3613), ('矣', 3614), ('紊', 3615), ('柿', 3616), ('匣', 3617), ('刁', 3618), ('鱿', 3619), ('邋', 3620), ('筠', 3621), ('※', 3622), ('淆', 3623), ('皂', 3624), ('鹜', 3625), ('竺', 3626), ('厥', 3627), ('窜', 3628), ('癖', 3629), ('馅', 3630), ('淌', 3631), ('攘', 3632), ('苓', 3633), ('斓', 3634), ('兮', 3635), ('夭', 3636), ('遢', 3637), ('驹', 3638), ('咪', 3639), ('喋', 3640), ('梗', 3641), ('屎', 3642), ('咀', 3643), ('瑛', 3644), ('幔', 3645), ('粽', 3646), ('鹭', 3647), ('茎', 3648), ('怠', 3649), ('噢', 3650), ('匡', 3651), ('沌', 3652), ('萤', 3653), ('铧', 3654), ('乒', 3655), ('睫', 3656), ('眈', 3657), ('阙', 3658), ('猖', 3659), ('滇', 3660), ('拌', 3661), ('潍', 3662), ('趸', 3663), ('葫', 3664), ('砺', 3665), ('撬', 3666), ('忡', 3667), ('〈', 3668), ('狩', 3669), ('裱', 3670), ('铂', 3671), ('檬', 3672), ('痊', 3673), ('锏', 3674), ('湮', 3675), ('悸', 3676), ('瓢', 3677), ('嚼', 3678), ('禹', 3679), ('粱', 3680), ('〉', 3681), ('崽', 3682), ('冗', 3683), ('=', 3684), ('贰', 3685), ('夯', 3686), ('乓', 3687), ('侮', 3688), ('笃', 3689), ('淤', 3690), ('涎', 3691), ('礴', 3692), ('汝', 3693), ('潞', 3694), ('侄', 3695), ('恪', 3696), ('吆', 3697), ('淼', 3698), ('呦', 3699), ('泓', 3700), ('怯', 3701), ('遴', 3702), ('荔', 3703), ('霓', 3704), ('沂', 3705), ('酵', 3706), ('勺', 3707), ('咫', 3708), ('尉', 3709), ('藩', 3710), ('墩', 3711), ('椰', 3712), ('簧', 3713), ('唾', 3714), ('柒', 3715), ('胧', 3716), ('薰', 3717), ('饕', 3718), ('桓', 3719), ('疮', 3720), ('泾', 3721), ('枣', 3722), ('瞿', 3723), ('槌', 3724), ('笋', 3725), ('钰', 3726), ('埠', 3727), ('蜿', 3728), ('蜒', 3729), ('熹', 3730), ('蠕', 3731), ('谧', 3732), ('钛', 3733), ('挝', 3734), ('羌', 3735), ('朦', 3736), ('丫', 3737), ('拂', 3738), ('醍', 3739), ('恺', 3740), ('赈', 3741), ('颚', 3742), ('睾', 3743), ('扉', 3744), ('匕', 3745), ('岌', 3746), ('荟', 3747), ('姝', 3748), ('餮', 3749), ('锄', 3750), ('锷', 3751), ('铎', 3752), ('暄', 3753), ('嘀', 3754), ('秽', 3755), ('萦', 3756), ('啬', 3757), ('芜', 3758), ('栾', 3759), ('眸', 3760), ('菩', 3761), ('踞', 3762), ('糅', 3763), ('湃', 3764), ('獗', 3765), ('芋', 3766), ('瀛', 3767), ('鬃', 3768), ('瞅', 3769), ('焉', 3770), ('昙', 3771), ('纭', 3772), ('裳', 3773), ('蛊', 3774), ('茱', 3775), ('罹', 3776), ('奂', 3777), ('阜', 3778), ('氟', 3779), ('嵘', 3780), ('篡', 3781), ('Ⅲ', 3782), ('濮', 3783), ('蛤', 3784), ('逞', 3785), ('撮', 3786), ('篱', 3787), ('璞', 3788), ('岔', 3789), ('铿', 3790), ('钝', 3791), ('痞', 3792), ('扒', 3793), ('祀', 3794), ('苇', 3795), ('峪', 3796), ('瞠', 3797), ('腱', 3798), ('莽', 3799), ('溺', 3800), ('蚤', 3801), ('珐', 3802), ('茬', 3803), ('晾', 3804), ('疚', 3805), ('俺', 3806), ('炖', 3807), ('矗', 3808), ('飒', 3809), ('彷', 3810), ('咄', 3811), ('掰', 3812), ('橹', 3813), ('颊', 3814), ('笙', 3815), ('蒿', 3816), ('泗', 3817), ('卒', 3818), ('宸', 3819), ('馒', 3820), ('砾', 3821), ('沥', 3822), ('嗽', 3823), ('寅', 3824), ('羲', 3825), ('螳', 3826), ('铠', 3827), ('漪', 3828), ('遛', 3829), ('姣', 3830), ('浒', 3831), ('荃', 3832), ('焱', 3833), (']', 3834), ('铀', 3835), ('聋', 3836), ('猥', 3837), ('诽', 3838), ('丞', 3839), ('[', 3840), ('α', 3841), ('忱', 3842), ('呗', 3843), ('榨', 3844), ('抠', 3845), ('叱', 3846), ('囱', 3847), ('啼', 3848), ('骰', 3849), ('隼', 3850), ('虱', 3851), ('皿', 3852), ('哼', 3853), ('眯', 3854), ('嚎', 3855), ('汾', 3856), ('唉', 3857), ('憩', 3858), ('哉', 3859), ('嗒', 3860), ('捅', 3861), ('猝', 3862), ('刨', 3863), ('猾', 3864), ('酯', 3865), ('鲶', 3866), ('谤', 3867), ('枭', 3868), ('蟾', 3869), ('锌', 3870), ('唏', 3871), ('曰', 3872), ('於', 3873), ('犁', 3874), ('诃', 3875), ('籽', 3876), ('垩', 3877), ('膛', 3878), ('唠', 3879), ('斟', 3880), ('稼', 3881), ('蜻', 3882), ('①', 3883), ('Ø', 3884), ('™', 3885), ('揍', 3886), ('拣', 3887), ('觎', 3888), ('叼', 3889), ('缮', 3890), ('痹', 3891), ('拗', 3892), ('揉', 3893), ('蟑', 3894), ('浚', 3895), ('汕', 3896), ('烬', 3897), ('è', 3898), ('蜓', 3899), ('胤', 3900), ('轼', 3901), ('猕', 3902), ('剿', 3903), ('榷', 3904), ('祉', 3905), ('泯', 3906), ('捺', 3907), ('鄙', 3908), ('晦', 3909), ('蹬', 3910), ('婿', 3911), ('虏', 3912), ('璋', 3913), ('莠', 3914), ('\x1f', 3915), ('搀', 3916), ('狈', 3917), ('绌', 3918), ('瘟', 3919), ('枷', 3920), ('觊', 3921), ('咤', 3922), ('辍', 3923), ('啪', 3924), ('缨', 3925), ('呜', 3926), ('钒', 3927), ('鹃', 3928), ('涓', 3929), ('霹', 3930), ('谛', 3931), ('亵', 3932), ('腼', 3933), ('蔷', 3934), ('〕', 3935), ('浣', 3936), ('赣', 3937), ('雳', 3938), ('饵', 3939), ('眶', 3940), ('翌', 3941), ('腮', 3942), ('瞥', 3943), ('腆', 3944), ('愫', 3945), ('桨', 3946), ('桔', 3947), ('绢', 3948), ('娩', 3949), ('椋', 3950), ('凋', 3951), ('鞘', 3952), ('惚', 3953), ('憎', 3954), ('旎', 3955), ('惦', 3956), ('跤', 3957), ('烽', 3958), ('〔', 3959), ('澧', 3960), ('喙', 3961), ('魇', 3962), ('贻', 3963), ('怂', 3964), ('赦', 3965), ('殃', 3966), ('涟', 3967), ('邝', 3968), ('祁', 3969), ('殉', 3970), ('芹', 3971), ('羔', 3972), ('昀', 3973), ('袒', 3974), ('麾', 3975), ('轲', 3976), ('咆', 3977), ('弋', 3978), ('蟆', 3979), ('驿', 3980), ('脐', 3981), ('珉', 3982), ('蕊', 3983), ('霁', 3984), ('蜍', 3985), ('螈', 3986), ('佯', 3987), ('惰', 3988), ('馥', 3989), ('踹', 3990), ('眺', 3991), ('渥', 3992), ('祠', 3993), ('蓟', 3994), ('¾', 3995), ('臼', 3996), ('瘪', 3997), ('懊', 3998), ('掂', 3999), ('禀', 4000), ('喽', 4001), ('蹭', 4002), ('贮', 4003), ('漾', 4004), ('涧', 4005), ('鲟', 4006), ('咐', 4007), ('摁', 4008), ('裆', 4009), ('钳', 4010), ('谑', 4011), ('舔', 4012), ('琨', 4013), ('缜', 4014), ('渍', 4015), ('昴', 4016), ('ü', 4017), ('肮', 4018), ('蛾', 4019), ('毡', 4020), ('蔑', 4021), ('秤', 4022), ('锢', 4023), ('焊', 4024), ('髻', 4025), ('摹', 4026), ('帼', 4027), ('邯', 4028), ('②', 4029), ('昶', 4030), ('‰', 4031), ('诩', 4032), ('涮', 4033), ('茁', 4034), ('睽', 4035), ('锚', 4036), ('袄', 4037), ('珞', 4038), ('町', 4039), ('鬣', 4040), ('诣', 4041), ('黔', 4042), ('臆', 4043), ('蔼', 4044), ('岖', 4045), ('梧', 4046), ('苔', 4047), ('糜', 4048), ('冽', 4049), ('菠', 4050), ('镰', 4051), ('掮', 4052), ('颌', 4053), ('鏖', 4054), ('蹂', 4055), ('躏', 4056), ('腋', 4057), ('殇', 4058), ('漱', 4059), ('膳', 4060), ('垢', 4061), ('泸', 4062), ('坨', 4063), ('铛', 4064), ('搂', 4065), ('妾', 4066), ('嗦', 4067), ('札', 4068), ('诘', 4069), ('偕', 4070), ('籁', 4071), ('嗡', 4072), ('玟', 4073), ('鹫', 4074), ('钚', 4075), ('炊', 4076), ('澍', 4077), ('卯', 4078), ('迢', 4079), ('隘', 4080), ('溥', 4081), ('遁', 4082), ('馍', 4083), ('袤', 4084), ('嘶', 4085), ('唧', 4086), ('垣', 4087), ('甭', 4088), ('胫', 4089), ('嘈', 4090), ('濡', 4091), ('唬', 4092), ('A', 4093), ('懦', 4094), ('迂', 4095), ('孽', 4096), ('翱', 4097), ('犒', 4098), ('闰', 4099), ('铤', 4100), ('胄', 4101), ('垡', 4102), ('幌', 4103), ('犊', 4104), ('喃', 4105), ('蹒', 4106), ('跚', 4107), ('晗', 4108), ('殡', 4109), ('棣', 4110), ('柚', 4111), ('蕙', 4112), ('荚', 4113), ('`', 4114), ('⋯', 4115), ('煊', 4116), ('哽', 4117), ('馋', 4118), ('蛆', 4119), ('馁', 4120), ('涝', 4121), ('睬', 4122), ('鸠', 4123), ('冼', 4124), ('痫', 4125), ('茉', 4126), ('遨', 4127), ('纣', 4128), ('靳', 4129), ('胰', 4130), ('芥', 4131), ('咂', 4132), ('搓', 4133), ('哆', 4134), ('砰', 4135), ('恙', 4136), ('浊', 4137), ('攫', 4138), ('啄', 4139), ('嗖', 4140), ('獒', 4141), ('霏', 4142), ('扈', 4143), ('榭', 4144), ('祛', 4145), ('磺', 4146), ('倭', 4147), ('◇', 4148), ('涸', 4149), ('苷', 4150), ('讧', 4151), ('拄', 4152), ('惭', 4153), ('搪', 4154), ('蜚', 4155), ('鸳', 4156), ('鲤', 4157), ('毓', 4158), ('岱', 4159), ('骅', 4160), ('钠', 4161), ('酰', 4162), ('镳', 4163), ('芮', 4164), ('偌', 4165), ('潦', 4166), ('藕', 4167), ('啧', 4168), ('脍', 4169), ('嗣', 4170), ('濠', 4171), ('瞳', 4172), ('簸', 4173), ('疹', 4174), ('à', 4175), ('菅', 4176), ('‧', 4177), ('徨', 4178), ('阂', 4179), ('搡', 4180), ('庶', 4181), ('梢', 4182), ('鸯', 4183), ('讹', 4184), ('妊', 4185), ('篆', 4186), ('嫔', 4187), ('後', 4188), ('『', 4189), ('』', 4190), ('G', 4191), ('犰', 4192), ('狳', 4193), ('珥', 4194), ('抡', 4195), ('惘', 4196), ('羸', 4197), ('虔', 4198), ('惴', 4199), ('掣', 4200), ('熨', 4201), ('讥', 4202), ('蹶', 4203), ('衩', 4204), ('嗔', 4205), ('莺', 4206), ('疙', 4207), ('瘩', 4208), ('呃', 4209), ('夙', 4210), ('锲', 4211), ('攸', 4212), ('↑', 4213), ('掳', 4214), ('茗', 4215), ('叩', 4216), ('孪', 4217), ('哩', 4218), ('丕', 4219), ('楔', 4220), ('郦', 4221), ('獭', 4222), ('燎', 4223), ('谩', 4224), ('愕', 4225), ('狞', 4226), ('渭', 4227), ('衙', 4228), ('唆', 4229), ('涕', 4230), ('瘠', 4231), ('祟', 4232), ('怅', 4233), ('窿', 4234), ('咔', 4235), ('黝', 4236), ('拈', 4237), ('恕', 4238), ('啷', 4239), ('浜', 4240), ('蔻', 4241), ('潺', 4242), ('纂', 4243), ('罡', 4244), ('H', 4245), ('Ⅶ', 4246), ('箴', 4247), ('舛', 4248), ('踌', 4249), ('躇', 4250), ('煦', 4251), ('藐', 4252), ('遑', 4253), ('咚', 4254), ('鸵', 4255), ('碾', 4256), ('衢', 4257), ('琶', 4258), ('泞', 4259), ('▲', 4260), ('婀', 4261), ('湄', 4262), ('筱', 4263), ('轧', 4264), ('邑', 4265), ('靛', 4266), ('鼬', 4267), ('魈', 4268), ('讷', 4269), ('瘸', 4270), ('攥', 4271), ('裨', 4272), ('杞', 4273), ('撂', 4274), ('拴', 4275), ('跆', 4276), ('腑', 4277), ('弑', 4278), ('徜', 4279), ('馗', 4280), ('忻', 4281), ('珈', 4282), ('灸', 4283), ('翊', 4284), ('佰', 4285), ('√', 4286), ('―', 4287), ('胱', 4288), ('麂', 4289), ('祚', 4290), ('铢', 4291), ('漳', 4292), ('樵', 4293), ('侬', 4294), ('忏', 4295), ('笆', 4296), ('幄', 4297), ('偎', 4298), ('叽', 4299), ('葩', 4300), ('锵', 4301), ('吱', 4302), ('娣', 4303), ('徉', 4304), ('冢', 4305), ('廿', 4306), ('皑', 4307), ('蛹', 4308), ('③', 4309), ('鲑', 4310), ('闳', 4311), ('鳗', 4312), ('椁', 4313), ('嗷', 4314), ('阑', 4315), ('怵', 4316), ('牒', 4317), ('恣', 4318), ('憔', 4319), ('悴', 4320), ('盹', 4321), ('亘', 4322), ('峦', 4323), ('Ⅰ', 4324), ('帚', 4325), ('蝌', 4326), ('歆', 4327), ('槐', 4328), ('蟠', 4329), ('舷', 4330), ('舸', 4331), ('汞', 4332), ('豉', 4333), ('蝓', 4334), ('伫', 4335), ('蘸', 4336), ('灏', 4337), ('掬', 4338), ('咙', 4339), ('酗', 4340), ('噎', 4341), ('蜷', 4342), ('C', 4343), ('贲', 4344), ('&', 4345), ('↓', 4346), ('褂', 4347), ('懋', 4348), ('蚪', 4349), ('蹴', 4350), ('甬', 4351), ('淅', 4352), ('郸', 4353), ('橇', 4354), ('洱', 4355), ('£', 4356), ('〖', 4357), ('〗', 4358), ('孱', 4359), ('雹', 4360), ('幺', 4361), ('谲', 4362), ('糗', 4363), ('谚', 4364), ('酮', 4365), ('颦', 4366), ('岷', 4367), ('摞', 4368), ('忒', 4369), ('赓', 4370), ('霰', 4371), ('∩', 4372), ('啮', 4373), ('磐', 4374), ('恿', 4375), ('帛', 4376), ('悯', 4377), ('旖', 4378), ('搔', 4379), ('俚', 4380), ('偃', 4381), ('恻', 4382), ('烩', 4383), ('娠', 4384), ('吒', 4385), ('坂', 4386), ('痰', 4387), ('T', 4388), ('荥', 4389), ('豌', 4390), ('楹', 4391), ('铱', 4392), ('β', 4393), ('铯', 4394), ('潸', 4395), ('崴', 4396), ('擞', 4397), ('狰', 4398), ('悻', 4399), ('啻', 4400), ('壕', 4401), ('骛', 4402), ('嗤', 4403), ('塾', 4404), ('纫', 4405), ('喳', 4406), ('辘', 4407), ('颢', 4408), ('鎏', 4409), ('嫡', 4410), ('稔', 4411), ('痼', 4412), ('蹩', 4413), ('瘀', 4414), ('迩', 4415), ('孀', 4416), ('戾', 4417), ('鬓', 4418), ('痘', 4419), ('Ⅳ', 4420), ('樾', 4421), ('缰', 4422), ('蔗', 4423), ('栎', 4424), ('傀', 4425), ('卞', 4426), ('蚝', 4427), ('谕', 4428), ('焙', 4429), ('糯', 4430), ('狒', 4431), ('蛞', 4432), ('鹈', 4433), ('鹕', 4434), ('仨', 4435), ('嗨', 4436), ('霎', 4437), ('唔', 4438), ('纾', 4439), ('楞', 4440), ('壑', 4441), ('骊', 4442), ('濑', 4443), ('诬', 4444), ('泱', 4445), ('倜', 4446), ('傣', 4447), ('滟', 4448), ('寮', 4449), ('儡', 4450), ('喱', 4451), ('拮', 4452), ('栓', 4453), ('蕨', 4454), ('≠', 4455), ('粼', 4456), ('蛀', 4457), ('钿', 4458), ('钨', 4459), ('£', 4460), ('疡', 4461), ('吡', 4462), ('纰', 4463), ('瓮', 4464), ('踉', 4465), ('箫', 4466), ('惆', 4467), ('>', 4468), ('樽', 4469), ('仝', 4470), ('嗲', 4471), ('诿', 4472), ('聿', 4473), ('褛', 4474), ('腌', 4475), ('嚏', 4476), ('腴', 4477), ('柑', 4478), ('饬', 4479), ('羿', 4480), ('漕', 4481), ('卤', 4482), ('瘙', 4483), ('≤', 4484), ('渚', 4485), ('俸', 4486), ('喵', 4487), ('泠', 4488), ('挛', 4489), ('鳖', 4490), ('诋', 4491), ('蚌', 4492), ('笠', 4493), ('幡', 4494), ('羯', 4495), ('傥', 4496), ('谒', 4497), ('酉', 4498), ('摺', 4499), ('氘', 4500), ('唰', 4501), ('拚', 4502), ('跄', 4503), ('揶', 4504), ('揄', 4505), ('镌', 4506), ('摈', 4507), ('杵', 4508), ('奄', 4509), ('苜', 4510), ('蓿', 4511), ('阋', 4512), ('庾', 4513), ('麝', 4514), ('囡', 4515), ('鼹', 4516), ('屐', 4517), ('盂', 4518), ('飕', 4519), ('箔', 4520), ('荀', 4521), ('樨', 4522), ('羟', 4523), ('炔', 4524), ('谟', 4525), ('锆', 4526), ('O', 4527), ('鳃', 4528), ('讪', 4529), ('痉', 4530), ('铩', 4531), ('恃', 4532), ('诨', 4533), ('蔫', 4534), ('蹋', 4535), ('阖', 4536), ('桎', 4537), ('梏', 4538), ('胭', 4539), ('殓', 4540), ('绛', 4541), ('鸸', 4542), ('鹋', 4543), ('逵', 4544), ('潼', 4545), ('钴', 4546), ('疱', 4547), ('褥', 4548), ('铬', 4549), ('の', 4550), ('蝰', 4551), ('稷', 4552), ('ä', 4553), ('脲', 4554), ('铍', 4555), ('鲼', 4556), ('撷', 4557), ('耷', 4558), ('赅', 4559), ('呻', 4560), ('牍', 4561), ('涣', 4562), ('N', 4563), ('啕', 4564), ('陲', 4565), ('镣', 4566), ('瞌', 4567), ('酩', 4568), ('嚓', 4569), ('§', 4570), ('吭', 4571), ('罔', 4572), ('粕', 4573), ('脓', 4574), ('绫', 4575), ('燮', 4576), ('陂', 4577), ('麽', 4578), ('銮', 4579), ('钜', 4580), ('皋', 4581), ('谘', 4582), ('*', 4583), ('湍', 4584), ('烊', 4585), ('闾', 4586), ('ン', 4587), ('珙', 4588), ('桀', 4589), ('捶', 4590), ('庖', 4591), ('跺', 4592), ('陛', 4593), ('嗑', 4594), ('擘', 4595), ('焯', 4596), ('唁', 4597), ('怦', 4598), ('忿', 4599), ('刽', 4600), ('"', 4601), ('伉', 4602), ('褚', 4603), ('垠', 4604), ('湫', 4605), ('麋', 4606), ('祯', 4607), ('蟋', 4608), ('蟀', 4609), ('僮', 4610), ('珩', 4611), ('榉', 4612), ('铰', 4613), ('坻', 4614), ('謦', 4615), ('滦', 4616), ('邙', 4617), ('荭', 4618), ('氚', 4619), ('骜', 4620), ('荤', 4621), ('黠', 4622), ('囔', 4623), ('孺', 4624), ('噜', 4625), ('剁', 4626), ('B', 4627), ('秧', 4628), ('脯', 4629), ('捎', 4630), ('瘁', 4631), ('缥', 4632), ('甥', 4633), ('痍', 4634), ('榔', 4635), ('沅', 4636), ('瞑', 4637), ('囿', 4638), ('胛', 4639), ('绥', 4640), ('锹', 4641), ('吏', 4642), ('咦', 4643), ('篝', 4644), ('娑', 4645), ('绉', 4646), ('嗝', 4647), ('胥', 4648), ('腭', 4649), ('淄', 4650), ('顼', 4651), ('颛', 4652), ('÷', 4653), ('亳', 4654), ('瓯', 4655), ('皖', 4656), ('É', 4657), ('鞑', 4658), ('桅', 4659), ('颞', 4660), ('E', 4661), ('熵', 4662), ('砒', 4663), ('谏', 4664), ('撅', 4665), ('岿', 4666), ('蹉', 4667), ('跎', 4668), ('颧', 4669), ('缈', 4670), ('漉', 4671), ('筵', 4672), ('谆', 4673), ('吩', 4674), ('赳', 4675), ('佻', 4676), ('仃', 4677), ('罂', 4678), ('宦', 4679), ('岫', 4680), ('鲈', 4681), ('\xad', 4682), ('²', 4683), ('D', 4684), ('<', 4685), ('诲', 4686), ('唳', 4687), ('鄞', 4688), ('楣', 4689), ('臧', 4690), ('杳', 4691), ('ó', 4692), ('蕲', 4693), ('噔', 4694), ('碉', 4695), ('汩', 4696), ('淞', 4697), ('诏', 4698), ('鼾', 4699), ('搐', 4700), ('飨', 4701), ('沣', 4702), ('龈', 4703), ('酚', 4704), ('氩', 4705), ('锭', 4706), ('皎', 4707), ('鳕', 4708), ('蛎', 4709), ('吮', 4710), ('イ', 4711), ('碴', 4712), ('嫖', 4713), ('髋', 4714), ('琵', 4715), ('鹬', 4716), ('赡', 4717), ('婶', 4718), ('癣', 4719), ('掴', 4720), ('膘', 4721), ('蹑', 4722), ('轫', 4723), ('楦', 4724), ('吠', 4725), ('咿', 4726), ('骡', 4727), ('艮', 4728), ('盥', 4729), ('榫', 4730), (''', 4731), ('ル', 4732), ('倬', 4733), ('泔', 4734), ('€', 4735), ('疣', 4736), ('蝾', 4737), ('V', 4738), ('蛭', 4739), ('汨', 4740), ('淖', 4741), ('抿', 4742), ('皈', 4743), ('袅', 4744), ('徇', 4745), ('踱', 4746), ('婵', 4747), ('柩', 4748), ('讴', 4749), ('叁', 4750), ('彝', 4751), ('炕', 4752), ('斡', 4753), ('褓', 4754), ('醺', 4755), ('岬', 4756), ('芊', 4757), ('仟', 4758), ('戊', 4759), ('氙', 4760), ('笺', 4761), ('龛', 4762), ('镉', 4763), ('畿', 4764), ('逯', 4765), ('荞', 4766), ('敝', 4767), ('綦', 4768), ('揆', 4769), ('耦', 4770), ('S', 4771), ('F', 4772), ('蚩', 4773), ('獠', 4774), ('莆', 4775), ('掖', 4776), ('噤', 4777), ('殒', 4778), ('蓦', 4779), ('嘹', 4780), ('龅', 4781), ('荻', 4782), ('跛', 4783), ('琮', 4784), ('韭', 4785), ('|', 4786), ('琏', 4787), ('葳', 4788), ('璎', 4789), ('觞', 4790), ('妲', 4791), ('庵', 4792), ('嘞', 4793), ('徵', 4794), ('俾', 4795), ('锰', 4796), ('璜', 4797), ('烃', 4798), ('「', 4799), ('」', 4800), ('勐', 4801), ('秣', 4802), ('兖', 4803), ('豺', 4804), ('鲇', 4805), ('ç', 4806), ('洙', 4807), ('鲔', 4808), ('缂', 4809), ('狨', 4810), ('袢', 4811), ('锶', 4812), ('裥', 4813), ('ア', 4814), ('菏', 4815), ('P', 4816), ('镪', 4817), ('鲵', 4818), ('肽', 4819), ('啶', 4820), ('芾', 4821), ('碜', 4822), ('浔', 4823), ('捋', 4824), ('蜇', 4825), ('堑', 4826), ('苒', 4827), ('镭', 4828), ('嬗', 4829), ('捱', 4830), ('棂', 4831), ('栉', 4832), ('暌', 4833), ('鸢', 4834), ('牦', 4835), ('箩', 4836), ('瓒', 4837), ('扪', 4838), ('嵋', 4839), ('叻', 4840), ('沱', 4841), ('邛', 4842), ('锟', 4843), ('驮', 4844), ('隍', 4845), ('≥', 4846), ('樘', 4847), ('桢', 4848), ('磬', 4849), ('颉', 4850), ('圩', 4851), ('滢', 4852), ('犄', 4853), ('蝗', 4854), ('鲱', 4855), ('涔', 4856), ('睑', 4857), ('靼', 4858), ('郇', 4859), ('擢', 4860), ('劾', 4861), ('馏', 4862), ('哌', 4863), ('蝮', 4864), ('鹳', 4865), ('γ', 4866), ('枳', 4867), ('阉', 4868), ('嶙', 4869), ('峋', 4870), ('颀', 4871), ('捻', 4872), ('淬', 4873), ('窠', 4874), ('蕃', 4875), ('芷', 4876), ('榛', 4877), ('娼', 4878), ('濂', 4879), ('悱', 4880), ('旮', 4881), ('骞', 4882), ('藓', 4883), ('褴', 4884), ('桉', 4885), ('仄', 4886), ('襁', 4887), ('溧', 4888), ('ス', 4889), ('枸', 4890), ('\uf06c', 4891), ('秸', 4892), ('ö', 4893), ('螨', 4894), ('莨', 4895), ('秆', 4896), ('ラ', 4897), ('疽', 4898), ('缱', 4899), ('鸩', 4900), ('踮', 4901), ('啖', 4902), ('蜃', 4903), ('谶', 4904), ('椿', 4905), ('湎', 4906), ('氪', 4907), ('Ⅵ', 4908), ('耆', 4909), ('硒', 4910), ('簪', 4911), ('邡', 4912), ('í', 4913), ('洵', 4914), ('睇', 4915), ('崂', 4916), ('旯', 4917), ('囹', 4918), ('圄', 4919), ('骧', 4920), ('绺', 4921), ('儆', 4922), ('鸾', 4923), ('梆', 4924), ('隈', 4925), ('砧', 4926), ('醚', 4927), ('④', 4928), ('厝', 4929), ('郴', 4930), ('锗', 4931), ('螯', 4932), ('ê', 4933), ('赭', 4934), ('ジ', 4935), ('墒', 4936), ('痤', 4937), ('M', 4938), ('岘', 4939), ('藜', 4940), ('肛', 4941), ('X', 4942), ('坳', 4943), ('}', 4944), ('澹', 4945), ('醪', 4946), ('桁', 4947), ('谔', 4948), ('钌', 4949), ('芑', 4950), ('醴', 4951), ('螭', 4952), ('岙', 4953), ('痨', 4954), ('韪', 4955), ('晌', 4956), ('睢', 4957), ('枥', 4958), ('绻', 4959), ('跗', 4960), ('浃', 4961), ('怆', 4962), ('竽', 4963), ('嶂', 4964), ('噼', 4965), ('俎', 4966), ('荏', 4967), ('撵', 4968), ('聩', 4969), ('纨', 4970), ('轱', 4971), ('郗', 4972), ('玷', 4973), ('孑', 4974), ('á', 4975), ('倌', 4976), ('貔', 4977), ('貅', 4978), ('挞', 4979), ('氤', 4980), ('氲', 4981), ('甯', 4982), ('垭', 4983), ('箐', 4984), ('弼', 4985), ('钺', 4986), ('绗', 4987), ('戍', 4988), ('涪', 4989), ('盅', 4990), ('枋', 4991), ('瓴', 4992), ('#', 4993), ('泷', 4994), ('遽', 4995), ('蚬', 4996), ('嵇', 4997), ('箕', 4998), ('柘', 4999)])
def idtext_decode(idtext, vocab_dict):"""将id文本转换为字符文本"""return ' '.join([vocab_dict.get(i,'?') for i in idtext])
def process_text(filename,vocab_path,max_length=1000):""""""file_data = pd.read_csv(filename,sep='\t',engine='python',names=['label','content'],encoding='UTF-8')vocab_id = read_vocab(vocab_path)y = file_data['label'].map(label2id_dict)X=[]for words in file_data['content']:
#         将字符文本转换为id文本id_list = [vocab_id[x] for x in words if x in vocab_id]#         将文本pad为固定长度id_list_length = len(id_list)if id_list_length <= max_length:id_list.extend([0]*(max_length - id_list_length)) # PADelse:id_list = id_list[:max_length]X.append(id_list)return np.array(X),np.array(y)
process_text('./cnews.train.txt','./vocab.txt')
(array([[ 387, 1197, 2173, ...,    0,    0,    0],[ 199,  964,  280, ...,   14,    2,  101],[1108,  581,  157, ...,  709,    2,  381],...,[1687,   92,  397, ...,  163,   89,  135],[1687,   92,  397, ...,    0,    0,    0],[ 779,   25,  193, ...,   72,  358,  253]]),array([1, 1, 1, ..., 6, 6, 6], dtype=int64))

任务三

机器学习中的分类指标

我们针对一个应用场景建立好一个对应的机器学习模型之后,怎么去评价我们这个模型的好坏呢?这就需要一些指标来判断,下面针对分类问题,简单介绍几个性能指标。

精确率和召回率

准确率和召回率多用于二分类问题,一般可以结合混淆矩阵来分析,如下图所示:

首先解释下上图中的名词:

  • True Positive 真正性:预测为1, 实际为1
  • False Positive 假正性:预测为1, 实际为0
  • True Negative 真反性:预测为0, 实际为0
  • False Negative:假反性:预测为0, 实际为1
精确率(Precision)
  • 精确率就是在测试集上识别正确的正样本除以模型所有预测为正样本数目
P = TP/(TP+FP)
  • 还有一个名词非常容易跟精确率混淆,那就是准确率(accuracy)。准确率就是在测试集上识别正确的所有(正和负都有样本除以测试集数据总样本数
A = (TP+TN)/(TP+FP+FN+TN)
  • 一定要注意两者区别,一个是相对正样本而言,一个相对所有样本而言
召回率(Recall)
  • 召回率就是由预测正确的正样本数目除以测试集中实际正样本数目
R = TP/(TP+FN)
F1分数
  • 而F1是前两者的调和均值,更接近两个数中较小的那个,所有当P和R接近时,F值最大。F1-score多用于数据分布不均衡的问题、推荐系统等。

P-R曲线

  • 一般来说,精确率和召回率是互斥的,也就是说精确率高的话,召回率会变低;召回率高的话,精确率会变低
  • P-R曲线的P就是精确率,R就是召回率。用P作为纵坐标,R作为横坐标,就可以画出P-R曲线。
  • 其中平衡点就是P=R的点。P-R曲线越往右上角说明模型的性能越好

ROC和AUC

ROC
  • ROC全称“受试者工作特征”(Receiver Operating Characteristic)曲线
  • ROC曲线是以真正类率(true positive rate ,TPR)为纵坐标,以假正类率(false positive rate=FPR)为横坐标,两者的定义如下:

  • 个优秀分类器对应的ROC曲线应该尽量靠近单位方形的左上角。
  • ROC曲线有个很好的特性:当测试集中的正负样本的分布变化的时候,ROC曲线能够保持不变。在实际的数据集中经常会出现类不平衡现象,即负样本比正样本多很多(或者相反),而且测试数据中的正负样本的分布也可能随着时间变化。
AUC
  • AUC为ROC曲线下的面积,AUC值越大的分类器,正确率越高
  • AUC的物理意义为,随机给定一个正样本,一个负样本,使用分类器进行预测,设判断正样本为正的概率为P1,判断负样本为正的概率为P2,P1>P2的概率就是AUC值。

NLP-文本分类(2)相关推荐

  1. 第六课.NLP文本分类任务

    第六课目录 NLP文本分类简介 IMDB数据集准备 设置随机种子 下载IMDB并划分数据集 构建词汇表 使用torchtext生成batch WordAveraging 模型定义 加载由glove.6 ...

  2. fastText、TextCNN、TextRNN……这里有一套NLP文本分类深度学习方法库供你选择 作者:机器人圈 / 微信号:ROBO_AI发表时间 :2017-07-28 图:pixabay

    fastText.TextCNN.TextRNN--这里有一套NLP文本分类深度学习方法库供你选择 「机器人圈」编译:嗯~阿童木呀.多啦A亮 这个库的目的是探索用深度学习进行NLP文本分类的方法. 它 ...

  3. NLP文本分类大杀器:PET范式

    作者 | 周俊贤 整理 | NewBeeNLP 之前我们分享了NLP文本分类 落地实战五大利器!,今天我们以两篇论文为例,来看看Pattern Exploiting Training(PET)范式,可 ...

  4. NLP——文本分类模型(HAN)(三)

    NLP--文本分类模型(HAN)(三) 1.引入 1. NLP--文本分类模型(一) 2. NLP--文本分类模型(二) 在之前的文章中,我们介绍了基于CNN机制是如何应用于文本分类.近些年来Atte ...

  5. 【NLP文本分类算法集锦】零基础入门经典文本分类项目实战(附代码+数据集)

    前言 大家好,我是阿光. 本专栏整理了<NLP文本分类算法集锦>,内包含了各种常见的中英文文本分类算法,以及常见的NLP任务:情感分析.新闻分类以及谣言检测等. 文本分类是NLP的必备入门 ...

  6. 【NLP】NLP文本分类落地实战五大利器!

    作者 | 周俊贤 整理 | NewBeeNLP 文本分类是NLP领域的最常见工业应用之一,也是本人在过去的一年中接触到最多的NLP应用,本文「从工业的角度浅谈实际落地中文本分类的种种常见问题和优化方案 ...

  7. 用CNN做NLP文本分类竞赛

    点击我爱计算机视觉标星,更快获取CVML新技术 本文来自于FlyAI竞赛社区,对于想要了解NLP的朋友有帮助. 搜狗新闻文本分类是NLP的入门问题,本文使用keras框架通过构建CNN+BiGRU网络 ...

  8. NLP --- 文本分类(基于LDA的隐语意分析详解)

    前几节我们分析了向量空间模型(VSM).基于奇异值分解(SVD)的潜语意分析(LSA).基于概率的潜语意分析(PLSA)这些模型都是为了解决文本分类问题,他们各自有自己的优点和缺点,其中VSM模型简单 ...

  9. [NLP] 文本分类之TextCNN模型原理和实现(超详细)

    1. 模型原理 1.1论文 Yoon Kim在论文(2014 EMNLP) Convolutional Neural Networks for Sentence Classification提出Tex ...

  10. NLP文本分类 落地实战五大利器!

    作者 | 周俊贤 整理 | NewBeeNLP 文本分类是NLP领域的最常见工业应用之一,也是本人在过去的一年中接触到最多的NLP应用,本文「从工业的角度浅谈实际落地中文本分类的种种常见问题和优化方案 ...

最新文章

  1. k均值聚类算法考试例题_一文读懂K-means聚类算法
  2. pyqt5如何循环遍历控件名_如何用 PyQt5 快速构建一个简单的 GUI 应用
  3. androidexternal目录下新增一个可执行应用及编译
  4. guido正式发布python年份_Python 基础学习笔记.docx
  5. python 指定端口读取网站_Python实现局域网指定端口扫描
  6. MyEclipse下Struts2配置使用和Ajax、JSON的配合
  7. 在cmd命令行下编译运行C/C++源文件
  8. JUC:ReentrantLock互斥锁
  9. matlab 数学 应用论文,MATLAB在高等数学课程中的应用(图文)
  10. 手机端电子签名画板js插件
  11. 推荐收藏|9个国外知名免费高清图片素材网站
  12. 彻底搞懂CSS层叠上下文、层叠等级、层叠顺序、z-index
  13. 怎么用HTML表格中加上线条,如何在html的表格中加入边框线
  14. JAVA-----集合子接口Queue及其子接口Deque
  15. ICCV2021 | 医学影像等小数据集的非自然图像领域能否用transformer?
  16. DbVisualizer 解决中文乱码问题
  17. C语言排列组合(函数
  18. 信息论与编码 通信工程 曹瑞珂 P02014263
  19. MUR10060CT-ASEMI大功率快恢复模块
  20. (转载)libvirt 问题解决记录集

热门文章

  1. 【C语言】在VC中使用gotoxy函数实现光标的移动
  2. 控制系统仿真与计算机辅助设计第二版第二章,控制系统仿真与CAD 第2版
  3. python图像物体的自动标注_python中matplotlib实现随鼠标滑动自动标注代码实例
  4. gdc服务器维修员登录密码,gdc服务器密码
  5. Keil开发环境安装教程
  6. Win制作苹果IOS证书
  7. chrome浏览器控制台执行js脚本
  8. 关于学计算机的职业理想700字,计算机专业职业规划范文
  9. Xprinter XP-N160L 打印机驱动
  10. n2android,刚上车,中国移动N2开箱评测,好给力的说!