如何使用 Node.js 获取热门 GitHub 存储库?
方法:
- 获取整个 HTML 页面并使用请求包将其存储为字符串。
- 将 HTML 加载到 Cheerio 中并找到 CSS 选择器以提取存储库详细信息。
使用请求包:
请求包:请求被设计为进行 http 调用的最简单方式。它默认支持 HTTPS 并遵循重定向。
安装请求包:
$ npm install request
注意:在“app.js”文件所在的当前文件夹中运行此命令。
请求语法:
request(url, (error, response, body) => {
if(!error && response.statusCode == 200) {
statements to be executed.
}
}
参数:
- url:向其发出请求的 API 端点。
- response: HTTP 响应状态码表示特定的 HTTP 请求是否已成功完成。
- 正文:响应数据。
使用 Cheerio 包:
Cheerio 包:专为服务器设计的核心 jQuery 的快速、灵活和精简的实现。
安装cheerio包:
$ npm install cheerio
注意:在“app.js”文件所在的当前文件夹中运行此命令。
Cheerio 的语法:
const cheerio = require('cheerio')
const $ = cheerio.load(HTMLString)
$(CSS Selector).text('Hello there!')
$.html()
// Import request package
const request = require('request');
// Import cheerio package
const cheerio = require('cheerio');
// Github Trending Page URL
const url = 'https://github.com/trending';
// Get request to the URL
request.get(url, (error, response, body) => {
// If the response code is 200 and
// there is no error
if (!error && response.statusCode == 200) {
// Load HTML string into cheerio
const $ = cheerio.load(body);
// Below are the CSS selectors to
// fetch the data required
let temp = $('.Box-row')
let repos = $('.h3.lh-condensed a');
let data = [];
for (let i = 0; i < repos.length; i++) {
let reponame = $(temp[i])
.find('.h3.lh-condensed a')
.text().replace(
/[\n\r]+|[\s]{2, }/g, ' ').trim();
let repolanguage = $(temp[i])
.find(
'.f6.text-gray.mt-2 span span[itemprop="programmingLanguage"]')
.text()
.replace(/[\n\r]+|[\s]{2, }/g, ' ').trim();
let repostars = $(temp[i])
.find(
'.f6.text-gray.mt-2 .muted-link.d-inline-block.mr-3')
.text()
.replace(/[\n\r]+|[\s]{2, }/g, ' ').trim();
// Push the fetched data into an object
data.push({
'Repository': reponame,
'Language': repolanguage,
'Stars/Forks': repostars
})
}
// Display the Object created using console.table
console.table(data)
}
else {
console.log("Unable to fetch data from github");
}
});
输出: