Searchor es una biblioteca PyPi Python todo en uno que simplifica el web scraping, la obtención de información sobre un tema y la generación de URL de consultas de búsqueda. Searchor es una herramienta eficiente para los desarrolladores de Python, con muchas necesidades de desarrollo web en una, con soporte para más de 100 motores y motores personalizados permitidos, lo que facilita a los desarrolladores el uso para sus necesidades de programación web en Python sin depender de muchos terceros. dependencias partidistas. Además, Searchor tiene una amplia gama de soporte, incluida la interfaz de línea de comandos y pip.
Se requiere Python 3.7+
# MacOS / Linux (via Terminal)
python3 -m pip install -U searchor
# Windows (via CMD Prompt)
py -3 -m pip install -U searchor
>> > from searchor import Engine
>> > Engine . Google . search ( "Hello, World!" ))
' https : // www . google . com / search ? q = Hello % 2 C % 20 World % 21 '
>> > from searchor import Engine
>> > Engine . new ( "Colgate" , "https://www.colgate.com/en-us/search/all?term=" )
>> > Engine . Colgate . search ( "Hi world!" )
' https : // www . colgate . com / en - us / search / all ? term = Hi % 20 world !"
Inicio rápido de Searchor CLI
$ searchor Google " Hello World! " --copy
>> > from searchor import Information
>> > Information . scrape ( "https://google.com" )
>> > '{' title ': ' Google ', ' paragraphs ': [<p style="font-size:8pt;color:#70757a">© 2023 - <a href="/intl/en/policies/privacy/">Privacy</a> - <a href="/intl/en/policies/terms/">Terms</a></p>]}'
>> > from searchor import Information
>> > Information . getinfo ( "GitHub" )
>> > 'GitHub, Inc. is an Internet hosting service for software development and version control using Git. It provides the distributed version control of Git plus access control, bug tracking, software feature requests, task management, continuous integration, and wikis for every project. Headquartered in California, it has been a subsidiary of Microsoft since 2018.'
¡Eche un vistazo a más ejemplos en la carpeta de ejemplos!
Nota : Los nombres de los motores siguen la convención UpperCamelCase (por ejemplo: ChromeWebStore).
Construyendo la imagen de la ventana acoplable
$ docker build -t searchor .
Ejecutando el buscador en el contenedor acoplable
$ docker run --rm -it searchor sh
/usr/src/searchor/examples # python searchamazon.py
https://www.amazon.com/s ? k=Hello%2C%20World%21
v2.5.0
Information
de clase Enum.getinfo
en Information
Enum para recopilar información sobre un tema determinado, usando Wikipedia.web_scraper
en Information
Enum, para extraer web de una URL proporcionada.v2.5.2
En lugar de diferentes funciones para cada motor, Searchor v2.2.0
utiliza una única función con una enumeración Engine
. Esto hace que sea más fácil de usar y mantener. Si está migrando desde v2.0.0
, compare las diferencias entre los siguientes fragmentos:
# Searchor 2.0.0
from searchor import search , Engine
search ( "Hello, World!" , Engine . Google )
# Searchor v2.2.0
from searchor import Engine
Engine . Google . search ( "Hello, World!" )
¡Eche un vistazo a las pautas de contribución!