1. 原文档内容格式:

词组 拼音 次序
阿爸 a1'ba4 18137
阿昌族 a1'chang1'zu250849
阿斗 a1'dou3 42632
阿飞 a1'fei1 48603
阿富汗 a1'fu4'han43461
阿訇 a1'hong1 34432
阿拉伯数字 a1'la1'bo2'shu4'zi435937
阿拉伯语 a1'la1'bo2'yu330476
阿妈 a1'ma1 16220
阿门 a1'men2 47913
阿Q a1'qiu1 20845
阿司匹林 a1'si1'pi3'lin240294
阿嚏 a1'ti4 54643


2. 共3列内容,现在只提取第一列词表,并存入另一文件:

awk '{print $1}' ./CH_word_ls.txt > ./out.txt
其中 ./CH_word_ls.txt是输入文件名 


3. 如果想提取前两列,只需

awk '{print $1,$2}' ./CH_word_ls.txt > ./out.txt

4. 然后对文本进行去重并输出到文件CH_words:

sort out.txt | uniq > CH_words




GitHub 加速计划 / li / linux-dash
10.39 K
1.2 K
下载
A beautiful web dashboard for Linux
最近提交(Master分支:2 个月前 )
186a802e added ecosystem file for PM2 4 年前
5def40a3 Add host customization support for the NodeJS version 4 年前
Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐