📅  最后修改于: 2023-12-03 15:06:19.617000             🧑  作者: Mango
在新闻媒体中,事故新闻是一种常见的报道类型。事故新闻通常报道发生在各种场景下的突发事件,如车祸、火灾、自然灾害等。事故新闻报道的目的是向公众及时、准确地传达事件信息,引起社会关注,并提高民众的安全意识。
在实际中,事故新闻报道的数据源可能有多种。其中,较为常见的数据源包括各大新闻网站,如新浪、网易等,以及政府机构发布的事件通报,如安全生产监管局、气象局等。
要实现自动化的事故新闻报道,主要需要以下技术支持:
以下是一个简单的Python示例代码,使用网页爬虫将新浪新闻上的事故新闻报道爬取并保存为markdown格式:
import requests
from bs4 import BeautifulSoup
import markdown
def get_news():
url = 'https://news.sina.com.cn/accident/'
r = requests.get(url)
r.encoding = 'utf-8'
soup = BeautifulSoup(r.text, 'html.parser')
news_list = soup.find_all('div', class_='news-item')
news_markdown = ''
for news in news_list:
title = news.find('a').text
link = news.find('a').get('href')
pub_time = news.find('span', class_='fgray_time').text
news_markdown += f'## [{title}]({link})\n'
news_markdown += f'> {pub_time}\n\n'
return news_markdown
if __name__ == '__main__':
news = get_news()
news_html = markdown.markdown(news)
print(news_html)
该代码使用requests库和BeautifulSoup库实现了对新浪新闻事故新闻页面的爬取,将获取到的标题、链接、发布时间等信息保存为markdown格式的文本,最后转换为HTML格式并输出。