CaptionAI genera sin esfuerzo títulos de imágenes automáticos (texto alt ), descripciones, etiquetas y le ayuda a categorizar imágenes utilizando el poder de la IA.
Este proyecto ya no se mantiene.
Texto alt automático ( alt ) para imágenes que utilizan la detección de objetos con un modelo previamente entrenado.
Una biblioteca PHP muy simple para generar texto alt ( alt ) para imágenes utilizando un modelo de tensorflow previamente entrenado para detectar objetos en una imagen. Estos textos pueden proporcionar contexto sobre la imagen a los visitantes que no pueden ver imágenes en su navegador por cualquier motivo. Los lectores de pantalla también pueden recoger los textos alt para convertirlos en voz, proporcionando así contexto adicional a las personas con discapacidad visual y mejorando nuestra experiencia de usuario.
Esta pequeña e ingeniosa herramienta está inspirada en el proceso de generación de texto alt de Facebook.
La imagen puede contener: taza, maceta, computadora portátil | alt ="La imagen puede contener: 6 personas, taza, computadora portátil" style="max-width: 100%;"> La imagen puede contener: 6 personas, taza, computadora portátil | alt ="La imagen puede contener: 5 personas, automóvil, motocicleta" style="max-width: 100%;"> La imagen puede contener: 5 personas, automóvil, moto | alt ="La imagen puede contener: una persona, automóvil, autobús, camión, semáforo" style="max-width: 100%;"> La imagen puede contener: una persona, automóvil, autobús, camión, semáforo |
alt ="La imagen puede contener: silla, sofá" style="max-width: 100%;"> La imagen puede contener: silla, sofá | alt ="La imagen puede contener: pizza, mesa de comedor" style="max-width: 100%;"> La imagen puede contener: pizza, mesa de comedor | alt="La imagen puede contener: perro" style="ancho máximo: 100%;"> La imagen puede contener: perro | alt ="La imagen puede contener: pájaro" style="ancho máximo: 100%;"> La imagen puede contener: pájaro |
Requiere: PHP 7.1.3+, OpenCV, PHP OpenCV
Modelo utilizado: SSDLite COCO v2
Extraiga el paquete a través del compositor.
$ composer require ankitpokhrel/ alt
$ alt = new alt alt ( ' /path/to/image.ext ' );
echo $ alt -> alt (); // Image may contain: 6 person, cup, laptop
$ alt -> setImage ( ' /path/to/image.ext ' )-> alt (); // Image may contain: car, motorcycle
El umbral de clasificación está establecido en 30
de forma predeterminada. Puedes ajustarlo según tus necesidades.
$ alt -> setThreshold ( 25 );
De forma predeterminada, el alt tiene el prefijo Image may contain:
. Puede cambiar esto de la siguiente manera:
$ alt -> setPrefix ( ' Image has: ' );
Si desea mostrar el recuento de un objeto, puede hacerlo configurando una matriz countable
. person
es contable de forma predeterminada.
$ alt -> setImage ( ' /path/to/image.ext ' )-> alt (); // Image may contain: 5 person, dog, cup
// Adding dog as countable
$ alt -> setCountable ([ ' person ' , ' dog ' ])-> alt (); // Image may contain: 5 person, 2 dog, cup
El texto predeterminado se utiliza si el modelo no puede predecir ningún objeto dentro de un umbral determinado. El texto predeterminado predeterminado es No photo description available.
.
$ alt -> setDefaultText ( ' Some scenery. ' );