¿Hay alguna API para rastrear el resumen de papel?

13

Si tengo una lista muy larga de nombres de artículos, ¿cómo podría obtener un resumen de estos documentos de Internet o de cualquier base de datos?

Los nombres de los trabajos son como "Evaluación de la utilidad en la minería web para el dominio de la salud pública".

¿Alguien sabe alguna API que pueda darme una solución? Traté de rastrear Google Académico, sin embargo, Google bloqueó mi rastreador.

Alex Gao
fuente
2
Dudo que haya alguna API general para esto. Puede intentar rastrear varios servicios como Academia.edu, sitios de editoriales, etc. Sin embargo, sería más fácil construir primero una base de datos local de documentos y luego experimentar con la extracción de los resúmenes.
Wojciech Walczak
¡Gracias por tu respuesta! Ya he construido una base de datos local para esto. El problema de rastrear desde varios servicios es que tengo que establecer reglas de análisis para cada sitio web.
Alex Gao
Entonces, ¿qué hay de convertir archivos PDF a TXT y luego extraer los resúmenes con expresiones regulares?
Wojciech Walczak
¡Gracias! Sin embargo, el contrato establece que la descarga masiva de documentos no está permitida. Esto crea algo de dolor de cabeza.
Alex Gao
2
Creo que este enlace de respuesta de desbordamiento de pila da la mejor respuesta que puedo obtener. Quizás las personas que enfrentan este problema también podrían echar un vistazo a esta página.
Alex Gao

Respuestas:

8

Búscalo en:

Si obtiene una sola coincidencia de título exacta, entonces probablemente haya encontrado el artículo correcto y puede completar el resto de la información desde allí. Ambos le dan enlaces de descarga y salida estilo bibtex. Sin embargo, lo que probablemente desee hacer para obtener metadatos perfectos es descargar y analizar el pdf (si corresponde) y buscar un identificador de estilo DOI.

Sea amable y limite sus solicitudes si hace esto.

Alex I
fuente
5

arXiv tiene una API y descarga masiva, pero si desea algo para revistas pagas, será difícil de conseguir sin pagar un indexador como pubmed o elsevier o similar.

cwharland
fuente
1
muchas gracias. Sin embargo, arXiv proporciona los documentos que necesito.
Alex Gao