DSPy视觉模型支持【dspy.Image】
bigegpt 2025-01-12 11:35 6 浏览
DSPy 最近在测试版中增加了对 VLM 的支持。本文介绍使用 DSPy 从图像中提取属性。对于此示例,我们将了解如何从网站屏幕截图中提取有用的属性
1、定义签名
定义DSPy签名。注意 dspy.Image 输入字段:
import dspy
class WebsiteDataExtractionSignature(dspy.Signature):
"""Website data extraction"""
website_screenshot: dspy.Image = dspy.InputField(
desc="A screenshot of the website"
)
hero_text: str = dspy.OutputField(
desc="The hero text of the website"
)
website_description: str = dspy.OutputField(
desc="A description of the website"
)
call_to_action: str = dspy.OutputField(
desc="The call to action of the website"
)
color_palette: list[str] = dspy.OutputField(
desc="The color palette of the website"
)
font_palette: list[str] = dspy.OutputField(
desc="The font palette of the website"
)
2、定义模块
接下来使用 ChainOfThought 优化器和上一步中的签名定义一个简单的程序:
class WebsiteDataExtraction(dspy.Module):
"""Module for extracting structured data from website screenshots."""
def __init__(self):
self.website_data_extraction = dspy.ChainOfThought(
WebsiteDataExtractionSignature
)
# pylint: disable=missing-function-docstring
def forward(self, website_screenshot: str):
website_data = self.website_data_extraction(website_screenshot)
return website_data
3、最终代码
最后,编写一个函数来读取图像并通过调用上一步中的程序来提取属性:
def extract_website_data(website_screenshot_path: str):
"""Extract data from a website screenshot.
Args:
website_screenshot_path (str): Path to the website screenshot image
Returns:
dict: Extracted website data
"""
# Load the image
with open(website_screenshot_path, "rb") as image_file:
base64_data = base64.b64encode(image_file.read()).decode('utf-8').replace('\n', '')
image_data_uri = f"data:image/png;base64,{base64_data}"
website_data_extraction = WebsiteDataExtraction()
website_data = website_data_extraction(image_data_uri)
return website_data
if __name__ == "__main__":
dspy_lm = dspy.LM(model="openai/gpt-4o-mini")
dspy.config( lm=dspy_lm)
result = extract_website_data(
"src/vision_lm/data/langtrace-screenshot.png"
)
print(result)
4、可观察性
就是这样!如果您的开发需要可观察性,只需添加 langtrace.init() 即可从跟踪中获得更深入的见解。
5、源代码
你可以在此处找到此示例的完整源代码。
相关推荐
- 10w qps缓存数据库——Redis(redis缓存调优)
-
一、Redis数据库介绍:Redis:非关系型缓存数据库nosql:非关系型数据库没有表,没有表与表之间的关系,更不存在外键存储数据的形式为key:values的形式c语言写的服务(监听端口),用来存...
- Redis系列专题4--Redis配置参数详解
-
本文基于windowsX64,3.2.100版本讲解,不同版本默认配置参数不同在Redis中,Redis的根目录中有一个配置文件(redis.conf,windows下为redis.windows....
- 开源一夏 | 23 张图,4500 字从入门到精通解释 Redis
-
redis是目前出场率最高的NoSQL数据库,同时也是一个开源的数据结构存储系统,在缓存、数据库、消息处理等场景使用的非常多,本文瑞哥就带着大家用一篇文章入门这个强大的开源数据库——Redis。...
- redis的简单与集群搭建(redis建立集群)
-
Redis是什么?是开源免费用c语言编写的单线程高性能的(key-value形式)内存数据库,基于内存运行并支持持久化的nosql数据库作用主要用来做缓存,单不仅仅是做缓存,比如:redis的计数器生...
- 推荐几个好用Redis图形化客户端工具
-
RedisPlushttps://gitee.com/MaxBill/RedisPlusRedisPlus是为Redis可视化管理开发的一款开源免费的桌面客户端软件,支持Windows、Linux...
- 关于Redis在windows上运行及fork函数问题
-
Redis在将数据库进行持久化操作时,需要fork一个进程,但是windows并不支持fork,导致在持久化操作期间,Redis必须阻塞所有的客户端直至持久化操作完成。微软的一些工程师花费时间在解决在...
- 你必须懂的Redis十大应用场景(redis常见应用场景)
-
Redis作为一款高性能的键值存储数据库,在互联网业务中有着广泛的应用。今天,我们就来详细盘点一下Redis的十大常用业务场景,并附上Golang的示例代码和简图,帮助大家更好地理解和应用Redis。...
- 极简Redis配置(redis的配置)
-
一、概述Redis的配置文件位于Redis安装目录下,文件名为redis.conf(Windows名为redis.windows.conf,linux下的是redis.conf)你可以通过C...
- 什么是redis,怎么启动及如何压测
-
从今天起咱们一起来学习一下关于“redis监控与调优”的内容。一、Redis介绍Redis是一种高级key-value数据库。它跟memcached类似,不过数据可以持久化,而且支持的数据类型很丰富。...
- 一款全新Redis UI可视化管理工具,支持WebUI和桌面——P3X Redis UI
-
介绍P3XRedisUI这是一个非常实用的RedisGUI,提供响应式WebUI访问或作为桌面应用程序使用,桌面端是跨平台的,而且完美支持中文界面。Githubhttps://github....
- windows系统的服务器快速部署java项目环境地址
-
1、mysql:https://dev.mysql.com/downloads/mysql/(msi安装包)2、redis:https://github.com/tporadowski/redis/r...
- window11 下 redis 下载与安装(windows安装redis客户端)
-
#热爱编程是一种怎样的体验#window11下redis下载与安装1)各个版本redis下载(windows)https://github.com/MicrosoftArchive/r...
- 一款轻量级的Redis客户端工具,贼好用!
-
使用命令行来操作Redis是一件非常麻烦的事情,我们一般会选用客户端工具来操作Redis。今天给大家分享一款好用的Redis客户端工具TinyRDM,它的界面清新又优雅,希望对大家有所帮助!简介Ti...
- 一个.NET开发且功能强大的Windows远程控制系统
-
我们致力于探索、分享和推荐最新的实用技术栈、开源项目、框架和实用工具。每天都有新鲜的开源资讯等待你的发现!项目介绍SiMayRemoteMonitorOS是一个基于Windows的远程控制系统,完...
- Redis客户端工具详解(4款主流工具)
-
大家好,我是mikechen。Redis是大型架构的基石,也是大厂最爱考察内容,今天就给大家重点详解4款Redis工具@mikechen本篇已收于mikechen原创超30万字《阿里架构师进阶专题合集...
- 一周热门
- 最近发表
- 标签列表
-
- mybatiscollection (79)
- mqtt服务器 (88)
- keyerror (78)
- c#map (65)
- resize函数 (64)
- xftp6 (83)
- bt搜索 (75)
- c#var (76)
- mybatis大于等于 (64)
- xcode-select (66)
- mysql授权 (74)
- 下载测试 (70)
- skip-name-resolve (63)
- linuxlink (65)
- pythonwget (67)
- logstashinput (65)
- hadoop端口 (65)
- vue阻止冒泡 (67)
- oracle时间戳转换日期 (64)
- jquery跨域 (68)
- php写入文件 (73)
- kafkatools (66)
- mysql导出数据库 (66)
- jquery鼠标移入移出 (71)
- 取小数点后两位的函数 (73)