编程导论第一次上机测试

E. 信息抽取和统计

单点时限: 2.0 sec

内存限制: 512 MB

给定一串任意的字符串(除\n),我们需要将英文单词和数字进行词频统计,将字符串中所有的非英文字母和非数字的字符转换成空格,并对字符串用空格做分隔符,将单词和数字进行词频统计并存入字典,以key value 的形式输出,区分大小写。

如果字母和数字直接相邻,按一个单词计算,如AAAI2019是一个单词,而AAAI-19则被拆分为两个单词,I’m也被拆分为两个单词。

不需要你考虑很复杂的情况,只要按照上面的步骤进行就好。

输入格式

只有一行输入,需要你来分隔的字符串。

输出格式

对于字符串中的出现的单词或数字以及他们的词频。

每个单词或数字输出一行n m,中间以空格分隔。

代表单词或数字,代表元素出现的次数。

你可以以任意顺序输出这些单词。

样例

Input
Cunningham, Ward (June 27, 2002), What is a Wiki, WikiWikiWeb, archived from the original on April 16, 2008, retrieved April 10, 2008
Output
10 1
16 1
2002 1
2008 2
27 1
April 2
Cunningham 1
June 1
Ward 1
What 1
Wiki 1
WikiWikiWeb 1
a 1
archived 1
from 1
is 1
on 1
original 1
retrieved 1
the 1