Este proyecto combina visión por computadora con inteligencia artificial conversacional para analizar imágenes capturadas por la webcam:
- 📸 Usa un modelo Keras para clasificar imágenes, la cual se creo usando Teachable Machine.
- 🤖 Si el modelo no está seguro, pregunta a LlaVa qué hay en la imagen.
- 🧠 Se consulta a Ollama, una herramienta que permite correr LLM´s localment
- 📕 Librerías:
- Tensorflow 2.12.1 (Solo funciona con esta versión)
- numpy
- pillow
- matplot
- opencv
- ollama
- LlaVa:7b
Si se desea cambiar las clases que detecta la red, se debe crear una nueva en Teachable Machine y exportar el modelo,solamente se deben de modificar los archivos keras_model.h5 y labels.txt por los nuevos obtenidos.