- Recomendar algunas herramientas de investigación científica que me gusten (algunas se limitan al campo de la IA)
- Las herramientas marcadas como [Para probar] son herramientas que aún no he usado pero que considero útiles. Las probaré lo antes posible y decidiré si las conservaré según la experiencia.
- Recomiéndeme a través de problemas, etc. herramientas de investigación científica en el campo de la IA que le resulten útiles pero que no estén en esta lista. Gracias.
En términos generales, cuando necesito encontrar archivos PDF según el título de un artículo u otra información, primero uso dblp (los resultados de la búsqueda son claros y no se requiere Internet científico). Para algunos casos especiales, volvería a utilizar Google Scholar.
dblp: bibliografía de informática: un sitio web de consulta de artículos especialmente diseñado para CS, que incluye artículos de primer nivel que se pueden recuperar. Puede buscar los artículos del autor según conferencias, revistas, etc., lo cual resulta útil cuando desea buscar todos los artículos en una conferencia por computadora.
Google Scholar: además de buscar artículos, puede ver estadísticas de artículos y referencias de citas aquí. También puede obtener recordatorios de actualizaciones de artículos nuevos siguiendo a los autores o artículos y utilizar recomendaciones automáticas para proporcionar una biblioteca básica.
Académico semántico: se puede combinar con materiales externos para realizar un análisis semántico del artículo. Las funciones incluyen: mostrar citas y referencias, medir la influencia del artículo, mostrar gráficos en papel, generar automáticamente palabras clave (basadas en títulos), analizar autores, encontrar recursos adicionales en Internet (por ejemplo, videos relevantes de YouTube) y recomendar artículos.
arXiv: un sitio web de colección de preimpresiones de artículos.
arXiv-sanity: Tiene grandes mejoras con respecto a arXiv en términos de funcionalidad, incluida la visualización de resúmenes, comentarios y funciones sociales, de recomendación y de biblioteca muy básicas durante la navegación. La búsqueda también funciona mejor.
Semantic Sanity: un feed adaptable personalizado: cree su propio feed de lectura de arXiv personalizado. Al crear cada feed, se le pedirá que primero seleccione algunos artículos y luego comience a recomendar en función de estos artículos. Puede darle me gusta o no a los resultados recomendados para ayudar a ajustar los resultados recomendados.
Paper Digest: IA para rastrear y resumir artículos: proporciona una lista de artículos publicados el día anterior a la suscripción por correo electrónico, con un resumen de una oración de cada artículo. Lo que es más importante para mí es que este sitio web también organizará los artículos de cada conferencia importante cuando se publiquen.
Artículos con código: conecte artículos automáticamente al repositorio de GitHub y a los conjuntos de datos que implementan el código, y ordénelos según las colecciones de GitHub. Muestre el SOTA en cada tarea para comparar.
labmlai/annotated_deep_learning_paper_implementations: implementaciones de PyTorch de muchos algoritmos, con anotaciones en línea. La desventaja es que la parte que se muestra no se implementa desde cero y parte del código se coloca en su propio paquete.
Mendeley: Actualmente uso esto. Admite múltiples plataformas, como web, PC, Mac y teléfonos móviles, puede anotar y resaltar archivos PDF directamente y tiene almacenamiento gratuito en la nube con un límite.
Zotero: puede capturar directamente las referencias bibliográficas en la página web de la base de datos literaria. A menudo se utiliza junto con Nut Cloud para lograr la sincronización de múltiples extremos de la gestión de la literatura (compatible con MacOS, Windows, iPad, Linux, iOS).
Kimi Chat: producto similar a ChatPGT, todo el mundo debería estar familiarizado con él.
Cool Papers: un sitio web para escribir artículos desarrollado por el Sr. Su Jianlin. Puede explorarlo y utilizarlo usted mismo según el archivo README.
CopyTranslator: la mayor ventaja es que tiene funciones como fijar, hacer clic para copiar y monitorear el portapapeles. Se puede cambiar sin problemas al leer documentos y se usa en conjunto, lo cual es muy conveniente.
Saladict Saladict: complemento de traducción del navegador, con configuraciones muy ricas para adaptarse a los hábitos de uso del usuario. Además de los documentos oficiales, también puedes consultar Shalaqi + Alfred para crear la mejor experiencia de traducción de documentos. Ven y descúbrelo. También estoy explorando cómo implementar la traducción fuera del navegador en sistemas Windows.
Solía usar Evernote pero lo dejé y estoy considerando migrar.
Yuque: Muy liviano, suelo usar la versión web. En ocasiones se pueden sincronizar algunas listas con el teléfono móvil, lo que también resulta muy útil. Los nuevos estudiantes pueden completar mi código de invitación QPFTUN para recibir una membresía de 30 días: kissing_heart:
Notion: si necesita colaboración entre varias personas y gestión de proyectos, Notion puede ser más adecuado.
the-incredible-pytorch: varios tutoriales, proyectos, videos y otros recursos sobre PyTorch.
computervision-recipes: Producido por Microsoft, tutoriales sobre varias tareas de CV basados en PyTorch.
Pytorch-Project-Template: una plantilla de proyecto PyTorch extensible, que incluye ejemplos de segmentación de imágenes, clasificación de objetos, GAN y aprendizaje por refuerzo.
pytorch-template: otra plantilla de proyecto de PyTorch.
torchinfo: imprime información del modelo PyTorch, incluida la cantidad de parámetros de cada capa del modelo, el tamaño del tensor de salida, etc.
flops-counter.pytorch: Calcula los FLOP totales del modelo (operaciones de punto flotante, entendidas como la cantidad de cálculo, que se pueden utilizar para medir la complejidad del algoritmo / modelo) y la proporción de cada capa. La desventaja es que no parece admitir capas relacionadas con RNN y la información impresa no es muy cómoda de leer.
La última versión de PyTorch ya viene con tensorboard. Tutorial oficial.
visdom: [Por probar] Herramienta flexible para crear, organizar y compartir visualizaciones de datos enriquecidos en tiempo real.
Visualizador de convolución: si la configuración de la capa de convolución es relativamente compleja y no es conveniente calcular el tamaño de salida, puede utilizar esta herramienta de visualización como ayuda.
Búsqueda de conjuntos de datos de Google
Búsqueda de datos | Bifrost: Búsqueda visual de conjuntos de datos.
optuna: un marco para la optimización automática de hiperparámetros.
microsoft/nni: [Para ser probado] Un conjunto de herramientas de aprendizaje automático (AutoML) de código abierto para la búsqueda de modelos neuronales y el ajuste de hiperparámetros, que admite la mayoría de los marcos y entornos operativos convencionales.
Hyperopt: [Por probar] Optimización de hiperparámetros asincrónicos distribuidos. Vi a alguien recomendándolo en Zhihu, pero según la documentación, actualmente solo se admiten dos algoritmos de optimización y no incluyen la optimización bayesiana.
BoTorch: [Por probar] Biblioteca de optimización bayesiana basada en PyTorch.
automl/Auto-PyTorch: [Por probar] Búsqueda automática de estructuras y búsqueda de hiperparámetros basada en PyTorch.
Varias plantillas de LaTeX que incluyen artículos, informes, carteles, etc.
Plantillas del dorso
Plantillas de látex
Para la colaboración entre varias personas, recomiendo Overleaf, que también es mi elección la mayor parte del tiempo. Los proyectos unipersonales pueden utilizar VSCode para escribir LaTeX sin conexión y cooperar con bibliotecas privadas de Github para la gestión de versiones.
Puede consultar las recomendaciones de este artículo: Con estos sitios web, escribir artículos en inglés ya no es difícil (Introducción y consejos de uso de 15 sitios web de asistencia para la redacción de artículos en inglés) - Zhihu
Lingle: busque las colocaciones de palabras en inglés que aparecen con más frecuencia. Úselo cuando no esté seguro de si su expresión es correcta.
Corpus de inglés americano contemporáneo (COCA): puede consultar el corpus de colocaciones de palabras en inglés americano y puede verificar las oraciones específicas que usan esta palabra. Corpus Nacional Británico (BYU-BNC): Un corpus de inglés británico, con menos corpus que el de inglés americano.
Tesauro: convierta palabras de bajo nivel en palabras sinónimas de alto nivel.
ESODA: una herramienta de consulta de colocación de frases adecuada para la escritura en inglés chino producida por Tsinghua HCI Lab. Un corpus de artículos que puede cambiar direcciones de investigación específicas, mostrar usos alternativos relevantes y admitir búsquedas mixtas en chino e inglés.
Palabras y frases: frecuencia, géneros, colocaciones, concordancias, sinónimos y WordNet: use diferentes colores para distinguir palabras de alta, media y baja frecuencia, muestre vocabulario que represente el tipo de artículo y clasifique palabras reemplazables relacionadas. Aunque se dice que es una ayuda para la redacción en inglés, creo que su mayor utilidad es aprender vocabulario y colocaciones comúnmente utilizadas en artículos de campos relacionados.
Algunas opciones además de las diversas similares a ChatGPT. Tenga en cuenta los riesgos de fuga de las herramientas de detección en línea y maneje el texto clave con precaución.
Gramaticalmente: verifique y modifique la gramática, los patrones de oraciones, la puntuación y la selección de palabras con complementos del navegador.
Nounplus.net: corrector gramatical inglés gratuito en línea.
Mathpix: tome capturas de pantalla de ecuaciones matemáticas complejas y conviértalas en código LaTeX. Puede manejar impresiones en archivos PDF y fórmulas escritas a mano en fotografías, etc.
MyScript Webdemo: el módulo Math puede convertir fórmulas escritas a mano en código LaTeX al mismo tiempo, el módulo Diagram puede convertir diagramas de bloques dibujados a mano en diagramas de bloques ordenados.
Detexify el reconocimiento de símbolos escritos a mano en LaTeX: si olvida cómo representar ciertos caracteres en LaTeX, puede consultarlos escribiendo a mano en este sitio web.
OmniGraffle está disponible para sistemas Mac OS.
PPT suele ser mi primera opción: es rápido para comenzar, tiene muchos tipos, tiene un alto grado de libertad y admite la exportación de gráficos vectoriales.
Código de escritura de imágenes en papel: código de dibujo basado en LaTex, incluidos gráficos de líneas, histogramas, diagramas de dispersión, visualización de atención y gráficos de estructura.
dibujo académico: dibujo en Matlab/Python, utilizado principalmente para dibujar datos de series de tiempo.
Awesome-latex-drawing: dibujo en LaTeX, utilizado principalmente para dibujar redes bayesianas, descomposición de tensores, etc.
PlotNeuralNet: Python obtiene gráficos que se pueden usar en LaTeX, principalmente dibujando CNN.
Hay muchos sitios web que brindan servicios de conversión de imágenes en varios formatos. Aquí te dejamos sólo una breve lista, también puedes encontrar otros sitios web similares a través de los buscadores.
Convertir formato PNG/JPEG (ráster) a EPS/PDF (vectorial): convierta archivos de imagen en formato jpg, png a archivos eps.
Convertidor de EPS a PDF: también puede convertir archivos EPS a imágenes en otros formatos.
Recortar archivos PDF en línea - Herramientas PDF: recorta los bordes blancos de los archivos PDF.
TexLive viene con algunas herramientas de línea de comando:
epstopdf <file.eps>
;pdfcrop <file.pdf>
. ccf-deadlines: puede filtrar conferencias con fechas límite este año según la dirección de la investigación y el nivel del CCF. Es relativamente amigable con los estudiantes nacionales.
Plazos de las conferencias de IA: las conferencias se pueden filtrar según las direcciones de investigación. Pero parece que hace falta navegar científicamente por Internet para ver toda la información.
Lista de conferencias: ordenadas según fecha límite, las conferencias caducadas no aparecerán en la página de inicio. Hay una página donde puede ver qué conferencias se llevan a cabo en cada dirección de investigación, pero no hay forma de filtrar las conferencias que no han vencido según la dirección de investigación.
Socio de la conferencia: Lista de las últimas conferencias y revistas informáticas internacionales. Puede registrarse para seguir una conferencia o revista. Es relativamente completo, pero la información no se actualiza oportunamente.
Para fines de revisión ciega, a veces los enlaces a archivos (como el código fuente) deben ser anónimos. Algunas personas optan por crear una cuenta anónima en Github, pero crear una cuenta para cada ponencia en cada conferencia puede resultar demasiado engorroso. Encontré algunas herramientas que admiten el intercambio anónimo de archivos de la siguiente manera.
Dropbox: Probablemente el más utilizado.
Marco de ciencia abierta
higo compartido
Proceso de envío de artículos de Arxiv: simplemente lea este artículo para comprender el proceso de envío de un artículo a arXiv.
arxiv-latex-cleaner: limpia el código LaTeX del documento para cumplir con los requisitos de envío en arXiv. Lo más destacado es la capacidad de limpiar automáticamente todo el contenido comentado en el documento.
al dorso -> arxiv Proceso de envío fluido: si está utilizando el dorso (en lugar de compilar código LaTeX en un documento localmente), puede consultar este artículo para descargar primero el paquete de código fuente apropiado y luego considerar usar arxiv-latex-cleaner.
Proporcionar un código claro y reproducible para los artículos publicados puede hacer avanzar eficazmente este campo. A continuación se muestran algunas herramientas útiles para el código fuente abierto.
ReproducibilityChecklist-v2.0: una lista de verificación de reproducibilidad de aprendizaje automático que enumera qué documentos debe proporcionar para mejorar la reproducibilidad de su artículo.
pigar: una herramienta para generar automáticamente archivos de requisitos para proyectos de Python.
Simulador de lluvia Rainyscope: sonido de lluvia.
Sala de estudio de música de LofiGirl: sala de transmisión en vivo de música Lo-Fi.