`
Tonyguxu
  • 浏览: 272015 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

tianya数据分析

 
阅读更多

源文件数据格式:用户名 密码 注册邮箱

共 条记录,分别存储在tianya_1.txt——tianya_50.txt里,每个文件中平均约 条记录。

 

task1:获取一个文件中的所有的注册邮箱,并存入另一个文件中

 

获取一个邮箱即写入文件

ok

 

task2:task1中获取的邮箱中有重复注册邮箱,去除重复。

 

TODO :将邮箱保存在list中,如有存在则不append,再将list中的邮箱一起写入文件。

ok

 

统计单个文件里账户数及账户总数

效果如下:

文件名1 - 账户数目

文件名2 - 账户数目

...

total:xx

 

 

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics