腾讯AI实验室语料库的应用讨论

建议大家讨论交流腾讯800万汉字词句嵌入语料库的应用技术。
我在自己的小机器上,从800万语料库抽取的含有汉字《东》与《西》的词与短语。
抽取结果统计如下:
东[64435]左:22962, 中:31974, 右:9499, 总计:64435个词与短语
西[64699]左:25850, 中:32840, 右:6009, 总计:64699个词与短语
请朋友验证。
左,中,右指在词与短语的最左,中间,最右。

查询词:东
在词首:22962个
|东西1|东北4|东方5|东7|东莞10|
|东部11|东京12|东南20|东东21|东南亚22|…(略)

在中间:31975个
|什么东西9|买东西15|好东西16|安东尼17|吃东西18|
|广东省19|山东省23|新东方30|小东西33|广东队34|
|任何东西37|那些东西47|山东队49|苏东坡55|这种东西61|…(略)

在词尾:9499个
|广东2|山东3|京东6|股东8|毛泽东13|
|房东14|中东28|向东31|刘强东35|以东36|…(略)

有进行向量分析的朋友吗?一起分析它的格式