莒县网页设计_鸡西seo公司_科技有限公司是什么性质_设计师网上接单的网站 .citykey=['kunming','lijiang','xishuangbanna','baoshan','yuxi','qujing','puer','dehong','lincang','zhaotong','dali','quxiong','honghe','wenshan','nujiang','diqing']def getHTMLText(url): #获取网页源代码try:r = requests.get(url, timeout=300)r.raise_for_status() # 如果状态码不是200,产生异常r.encoding = 'utf-8' # 字符编码格式改成 utf-8return r.textexcept:# 异常处理return " error "def findHTMLText(text):#获取指定的内容soup = BeautifulSoup( text, "html.parser" ) #返回BeautifulSoup对象return soup.find_all(string=re.compile('^\d{1,4}$|^[\u4e00-\u9fa5]|(市)|(出院)|(例)|(人)|(年)|(月)|(日)|(时)')) # 结合正则表达式,实现字符串片段匹配def getCONTENT(url): #获取匹配的数据内容text = getHTMLText(url) # 获取html文本内容text = re.sub('\r|\n|\t', '', text)res = findHTMLText(text) # 匹配结果i=0for r in res:s = re.sub('\xa0','',r)res[i] = "".join(s.split())i+=1return resdef yunnanold(list,data=['云南省'],citylist=const.citylist):#老版本使用,数字没有分开的网页内容提取text = max(list,key=len) #提取字符串最长的列表值print(text)for k in citylist:if not k in text:result = k + '0' + '例'data.append(result)continueif k in '无死亡病例':if '无死亡病例' in text:result = '无死亡病例'data.append(result)continueif k=='医学观察':num = getText.get_str_btw(text, k, '人')result = k + num + '人'else:num = getText.get_str_btw(text, k, '例')result = k + num + '例'data.append(result)return datadef cleandataold(city,list,data=['云南省']): #依据城市删选出每个城市的病例数,默认是云南省new = False #是否是新增yfind = False #是否找到城市place = ''for l in list:if '新增' in l:new = Trueif '确诊' in l:new = Falseif city in '无死亡' and '无死亡' in l:result = '无死亡病例'data.append(result)breakif city in l:if new :continue#place = city + '新增'else:place = cityyfind = Trueif l.isdigit() and yfind :result = place+l+'例'yfind = Falsedata.append(result)if not new:return datareturn datadef cleandata(city,list,data=['云南省']): #依据城市删选出每个城市的病例数,默认是云南省citykey = cityyfind = True #是否找到城市数据cityfind = True #是否找到该城市place = ''text='' #将列表合并为一个字符串for l in list:text=text+l#print(text)while not getText.is_number(getText.get_str_btw(text,citykey,'例')):if getText.get_str_btw(text, citykey, '例').strip() == '':cityfind=Falsebreakpar = text.partition(citykey)text=par[2]if cityfind:num1 = getText.get_str_btw(text, citykey, '例')textpart = text.partition(citykey)[2]while not getText.is_number(getText.get_str_btw(textpart, citykey, '例')):if getText.get_str_btw(textpart, citykey, '例').strip() == '':yfind = Falsebreakpar = textpart.partition(citykey)textpart = par[2]if yfind: # 判断同一城市是否找到第2个数据num2 = getText.get_str_btw(textpart, citykey, '例')else:num2 = 0if int(num1) > int(num2):num = num1else:num = num2else:num = 0virus = citykey + str(num) + '例'#print(virus)data.append(virus)return datadef yunnan(list,data,citylist=const.citylist): #获取所有列表类型的数值print('getdynamicdata.yunnan()')for city in citylist:result = cleandata(city, list,data)return resultdef getlist(urllist, citylist=const.citylist,mutilist = ['云南省']):#默认是云南# urllist = getvirusdynamic.getdatalist() #直接获取从网页获取链接#print(urllist)for u in urllist:urlone = u[2]if not '肺炎疫情情况' in u[1]: #筛选只显示疫情情况continueres = getCONTENT(urlone)ldate = getText.get_str_btw(u[0],'[',']')#获取时期'''if datetime.datetime.strptime(ldate,'%Y-%m-%d')>datetime.datetime.strptime('2020-1-30','%Y-%m-%d'):print('new')mutilist = yunnan(res,mutilist,citylist)else:print('old')mutilist = yunnanold(res, mutilist, citylist)'''mutilist = yunnan(res, mutilist, citylist)mutilist.append(u[0]) #添加日期return mutilistdef getoldlinkdata():record = Total.objects.order_by('id').last()print(record.date_record)return record.date_recorddef geturllistfromdatabase():print('从数据库读取链接列表')urllist = []dayd = getoldlinkdata()print('fail')#list = Linktable.objects.filter(linkdate__gte = datetime.datetime.strptime('2020-2-9','%Y-%m-%d')).order_by("-id").all()#读取全部数据list = Linktable.objects.filter(linkdate__gte=dayd).order_by("-id") # 读取全部数据d=datetime.datetime.strptime('2020-1-20','%Y-%m-%d')for l in list:if not '肺炎疫情情况' in l.linktitle:continueif d == l.linkdate:continued=l.linkdateu = ('['+str(l.linkdate)+']', l.linktitle, l.linkvule)urllist.append(u)#urllist.reverse()print('打印geturllistfromdatabase()')print(urllist)return urllistdef getvirusdata(): #最终输入函数#云南省卫计委:#url = 'http://ynswsjkw.yn.gov.cn/wjwWebsite/web/col?id=UU157976428326282067&pId=UU145102906505319731&cn=xxgzbd&pcn=ztlm&pid=UU145102906505319731'urllist = geturllistfromdatabase()#urllist = [('[2020-2-4]','云南省卫生健康委员会关于云南省新型冠状病毒感染的肺炎疫情情况的通报','http://ynswsjkw.yn.gov.cn/wjwWebsite/web/doc/UU157987576940339792')]datalist= getlist(urllist, citylist=const.citylist, mutilist=['云南省']) # 默认是云南return datalistdef getvirusdata00():#单页1月31号之前的url1 = 'http://ynswsjkw.yn.gov.cn/wjwWebsite/web/doc/UU158004254342965198'kk = getCONTENT(url1)#print(kk)# new=cleandata(const.citylist,kk,data=['云南省'])datalist = yunnanold(kk, data=['云南省'], citylist=const.citylist)datalist.append('[2020-2-7]')# old=cleandataold(const.citylist,kk,data=['云南省'])#print(datalist)return datalistdef getvirusdata11():#单页1月31号之后的url1 = 'http://ynswsjkw.yn.gov.cn/wjwWebsite/web/doc/UU158101410083798470'kk = getCONTENT(url1)#print(kk)# new=cleandata(const.citylist,kk,data=['云南省'])datalist = yunnan(kk, data=['云南省'], citylist=const.citylist)datalist.append('[2020-2-6]')# old=cleandataold(const.citylist,kk,data=['云南省'])#print(datalist)return datalist">

一站式网站建设行业

安阳王新刚、爱战网关键词挖掘、永久使用、不限域名、自己如何做一个网络平台

在线客服人工系统?

莒县网页设计_鸡西seo公司_科技有限公司是什么性质_设计师网上接单的网站

前端技术:Layui、HTML、CSS、JS、JQuery等技术

软件开发能力公司装修属于什么费用个人简历模板范文手写企业网站的网址通常包括服务公司荡神改名免费表白网页在线生成制作合肥建站网站模板微餐饮建站费用青岛建设项目网站快速收录平台比亚迪新能源汽车秦阿里巴巴国际站每年的基础费用是武汉大学人民医院研究生院官网江西建筑人才网招聘十堰推广公司网页界面设计系统贵州企业seo荣耀手机商城官方网阜宁网站制作公司报价二建注册成功在哪里查剪辑软件单位建立一个官网多少钱网址你懂我意思正能量不用下载ios建站哪个好一点反向代理化妆品网站设计草图商品关键词举例c9设计软件个人独资企业注册深圳公司网站设计公司网络公司取名字参考大全最新

猜你喜欢

  • 友情链接:
  • 商业空间设计概述 启博学院的功能介绍 淘宝客云建站官网 恩施seo快速排名 最近时政新闻 开发公司工程部有什么人