孟加拉报纸和博客爬虫的集合。可用于挖掘孟加拉语文本数据以执行自然语言处理任务。
斯尔 | 站点名称 | 站点类型 | 语言 | 履带式 |
---|---|---|---|---|
1 | Prothom Alo - 孟加拉语 | 消息 | 孟加拉语 | prothomalo_bn.py |
2 | Prothom Alo - 英语 | 消息 | 英语 | prothomalo_en.py |
3 | 孟加拉国普拉蒂丁 | 消息 | 孟加拉语 | bdpratidin.py |
4 | 卡勒坎托 | 消息 | 孟加拉语 | kalerkantho.py |
5 | 每日Inqilab | 消息 | 孟加拉语 | inqilab.py |
6 | 萨马卡尔 | 消息 | 孟加拉语 | 萨马卡尔.py |
7 | 朱甘托尔 | 消息 | 孟加拉语 | jugantor.py |
8 | Ittefaq - 孟加拉语 | 消息 | 孟加拉语 | ittefaq_bn.py |
9 | Ittefaq - 英语 | 消息 | 英语 | ittefaq_en.py |
10 | 每日星报 - 孟加拉语 | 消息 | 孟加拉语 | daily_star.py |
11 | 阿南达巴扎尔 | 消息 | 孟加拉语 | 阿南达巴扎尔.py |
12 | Zee 新闻 - 孟加拉语 | 消息 | 孟加拉语 | crawler_zeenews.py |
13 | 美国之音 - 孟加拉语 | 消息 | 孟加拉语 | crawler_voabangla.py |
14 | 印度斯坦时报 - 孟加拉 | 消息 | 孟加拉语 | 印度斯坦时报.py |
15 | 商业标准 - 孟加拉 | 消息 | 孟加拉语 | 爬虫_tbs.py |
16 | 达卡论坛报 | 消息 | 孟加拉语 | 达卡论坛报.py |
17 号 | 国家电视台 | 消息 | 孟加拉语 | ntvbd.py |
18 | 印度快运 - 孟加拉 | 消息 | 孟加拉语 | 印度快报.py |
19 | 艾沙美 | 消息 | 孟加拉语 | eisamay.py |
20 | 阿马德·肖莫伊 | 消息 | 孟加拉语 | 戴尼卡马德斯莫伊.py |
21 | 孟加拉国日报 | 消息 | 孟加拉语 | daily_bangladesh.py |
22 号 | 桑巴德·普拉蒂丁 | 消息 | 孟加拉语 | 桑巴普拉蒂丁.py |
23 | 24 实时新闻 | 消息 | 孟加拉语 | 24livenews.py |
24 | 阿姆拉·邦杜 | 博客 | 孟加拉语 | 阿姆拉邦杜.py |
25 | 孟加拉语博客 | 博客 | 孟加拉语 | 孟加拉博客.py |
26 | 孟加拉新闻 24 | 消息 | 孟加拉语 | 孟加拉新闻24.py |
27 | Biggani.org | 博客 | 孟加拉语 | 比格尼 |
28 | 比根博客 | 博客 | 孟加拉语 | bigganblog.py |
29 | 比根·普鲁克提 | 博客 | 孟加拉语 | bigganprojukti.py |
30 | 比彦 | 博客 | 孟加拉语 | 比彦.py |
31 | 学员学院博客 | 博客 | 孟加拉语 | 学员学院博客.py |
32 | Subeen 的 cp 书 | 博客 | 孟加拉语 | cpsubeen.py |
33 | 波约通利皮 | 博客 | 孟加拉语 | crawler_porjotonlipi.py |
34 | 泰戈尔网 | 博客 | 孟加拉语 | crawler_tagoreweb.py |
35 | 达克加尔 | 消息 | 孟加拉语 | 达克加尔.py |
36 | 新闻动态 | 消息 | 孟加拉语 | dmp新闻.py |
37 | 印度语 | 博客 | 印地语 | 印度语.py |
38 | 贾格兰 | 消息 | 印地语 | 贾格兰.py |
39 | 尼尔比克 | 博客 | 孟加拉语 | 尼尔比克.py |
40 | 翁诺德里斯蒂 | 消息 | 孟加拉语 | onnodristy.py |
41 | 农业推广部 | 政府。门户网站 | 孟加拉语 | 门户网站 |
42 | 萨沙孟加拉 | 博客 | 孟加拉语 | 萨沙班格拉.py |
43 | 商店 | 博客 | 孟加拉语 | 商店商店.py |
44 | 宋格拉默笔记本 | 博客 | 孟加拉语 | songramernotebook.py |
45 | 苏宾 | 博客 | 孟加拉语 | subeen.py |
46 | 科技曲调 | 博客 | 孟加拉语 | 技术曲调.py |