📜  MetaFinder – 通过 Google 搜索域中的文档(1)

📅  最后修改于: 2023-12-03 15:02:55.770000             🧑  作者: Mango

MetaFinder – 通过 Google 搜索域中的文档

MetaFinder 是一款基于 Python 的程序,通过调用 Google 搜索接口,可以在特定域名下寻找特定类型的文档。它可以让程序员以更便捷的方式找到所需的文档资源,提高开发效率。

安装

要在本地计算机中运行 MetaFinder,请按照以下步骤安装:

  1. 安装 Python。

    MetaFinder 要求 Python 3.6 及以上版本。您可以从以下官方链接下载适用于您操作系统的 Python 安装包:Python.org

  2. 安装所需的 Python 库。

    MetaFinder 依赖 requestsgooglebeautifulsoup4 三个 Python 库,您可以使用以下命令在命令行中安装:

    pip install requests google beautifulsoup4
    
使用

MetaFinder 命令行参数如下:

usage: metafinder.py [-h] [-d DOMAIN] [-t FILETYPE] [-n NUMBER] query

通过 Google 搜索域中的文档

positional arguments:
  query                 搜索查询的关键字

optional arguments:
  -h, --help            show this help message and exit
  -d DOMAIN, --domain DOMAIN
                        域名限制,如:.edu.cn
  -t FILETYPE, --filetype FILETYPE
                        文件类型限制,如:pdf
  -n NUMBER, --number NUMBER
                        返回结果数量,默认为 10

例如,您想在 docs.python.org 域名下搜索关键字为 tutorial 的 PDF 文件,可以使用以下命令:

python metafinder.py -d docs.python.org -t pdf tutorial

返回结果:

Searching for 'tutorial filetype:pdf site:docs.python.org'...
1. 'Python Tutorial in PDF' - docs.python.org
   https://docs.python.org/3/tutorial/pdf/python-tutorial.pdf
2. 'Think Python' - docs.python.org
   https://docs.python.org/3.2/an-introduction.pdf
3. 'Python Module of the Week' - docs.python.org
   https://docs.python.org/3/tutorial/modules.pdf
...

上述结果显示以 docs.python.org 为域名限制,文件类型限制为 pdf,包含关键字 tutorial 的文档,共返回了默认的 10 个结果。

授权

MetaFinder 采用 MIT 授权证书,您可以在本地计算机上使用、复制和修改本软件,但 MetaFinder 不提供任何担保。详情请查看源代码中的 LICENSE 文件。

参考文献
  1. Python.org - Download Python
  2. Requests: HTTP for Humans
  3. Python Package Index - google
  4. Beautiful Soup Documentation