Licencia MIT
Este es el robot de imágenes que utiliza Gemini con Google Apps Script y Google Drive.
El reciente lanzamiento de Gemini como API accesible en Vertex AI y Google AI Studio permite a los desarrolladores integrar sus amplias capacidades en sus aplicaciones, revolucionando potencialmente campos como la educación, la atención médica y los negocios. Al agregar funciones aún más poderosas con el recientemente anunciado Gemini 1.5, esta herramienta promete un impacto aún mayor. Ref y Ref Creo que Gemini amplía significativamente el potencial para diversas aplicaciones en diversos campos. Para mostrar su potencial, este informe presenta un robot de imágenes que utiliza Gemini con Google Apps Script y Google Drive. Este es sólo un ejemplo de los muchos casos de uso atractivos que los desarrolladores pueden crear con Gemini.
Esta imagen ilustra el flujo de trabajo de este robot de imágenes.
Como requisito previo, se supone que algunas imágenes se colocan en una carpeta de su Google Drive y las descripciones de cada imagen se colocan en un corpus.
Como información adicional, esta aplicación de bot de imágenes aprovecha las llamadas a funciones con Gemini para analizar y procesar imágenes de manera eficiente. Como se describe en mi informe anterior "Guía para llamadas funcionales con Gemini y Google Apps Script: https://medium.com/google-cloud/guide-to-function-calling-with-gemini-and-google-apps-script- 0e058d472f45", este enfoque permite una integración perfecta de las capacidades de Gemini dentro del entorno de Google Apps Script, lo que permite una potente funcionalidad de procesamiento de imágenes.
Me preocupa que el proyecto de Google Apps Script en este caso pueda ser un poco complejo. Para simplificar las pruebas, lo preparé como una biblioteca de Google Apps Script. Puede usarlo directamente dentro de su propio proyecto o copiar y pegar los scripts en su proyecto de Google Apps Script si prefiere no usar la biblioteca.
A continuación se explica cómo utilizar la muestra como biblioteca. Instale la biblioteca siguiendo los siguientes pasos.
Crea un proyecto GAS.
Instale esta biblioteca.
1qdq-ey6H3-HkG0AF4Tp4ZVEAUx-YryHXB5ZPW7oE-BeXN-wH2-b1PT_Q
. En este caso, puedes ver cómo hacerlo en mi repositorio.
Además, habilite la API de lenguaje generativo en la consola API.
Después de la configuración anterior, se puede utilizar el siguiente script de muestra.
Esta biblioteca utiliza los siguientes 2 ámbitos.
https://www.googleapis.com/auth/script.external_request
https://www.googleapis.com/auth/generative-language.retriever
https://www.googleapis.com/auth/drive
Cuando se instala esta biblioteca, los alcances anteriores se instalan automáticamente en su proyecto de Google Apps Script.
Cree una nueva carpeta en su Google Drive.
Si ya tiene algunas imágenes, colóquelas en esta carpeta.
Copie y pegue el siguiente script en el editor de scripts de su proyecto de Google Apps Script. Y configure el ID de la carpeta creada en folderId
en la función init_
.
function init_ ( ) {
// Please set the folder ID of the folder including images.
const folderId = "###" ;
const newCorpusName = { name : "corpora/sample-corpus-1" , displayName : "sample corpus 1" } ;
const newDocumentName = { name : ` ${ newCorpusName . name } /documents/sample-document-1` , displayName : "sample document 1" } ;
return { folderId , newCorpusName , newDocumentName } ;
}
// This is a main function. This is used from the library.
const doGet = e => ImageBotApp . main ( { ... e , ... init_ ( ) } ) ;
// This is used for putting the existing images in the folder to the corpus.
function putImageDescriptionsToCorpus ( ) {
const res = ImageBotApp . putImageDescriptionsToCorpus ( init_ ( ) ) ;
console . log ( JSON . stringify ( res . map ( r => JSON . parse ( r . getContentText ( ) ) ) ) ) ;
}
Esta biblioteca se utiliza con aplicaciones web. Por lo tanto, implemente aplicaciones web de la siguiente manera. La información detallada se puede ver en el documento oficial.
Configúrelo utilizando el editor de secuencias de comandos de su proyecto de Google Apps Script.
https://script.google.com/macros/s/###/exec
.Cuando modifique el script de aplicaciones web de Google Apps, modifique la implementación como una nueva versión. De esta manera, el script modificado se refleja en las aplicaciones web. Por favor tenga cuidado con esto.
Puede ver los detalles de esto en mi informe "Reimplementación de aplicaciones web sin cambiar la URL de las aplicaciones web para un nuevo IDE".
Antes de continuar, si su carpeta contiene imágenes, ejecute la función putImageDescriptionsToCorpus
. Esto genera descripciones para sus imágenes y las agrega al corpus.
Para utilizar esta biblioteca:
Actualmente, puedes buscar y cargar imágenes como muestra.
MIT
Tanaike
Donar
v1.0.0 (22 de febrero de 2024)
ARRIBA