百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 热门文章 > 正文

离线在docker镜像方式部署ragflow0.17.2

bigegpt 2025-07-07 14:39 6 浏览

经常项目上会出现不能连外网的情况,要怎么使用ragflow镜像部署呢,这里提供详细的步骤。

1、下载基础镜像

根据docker-compose-base.yml及docker-compose.yml中的image配置信息,下载所需要的基础服务镜像。

# 创建资源目录
mkdir -p /data/ragflow-offline/{docker-images,pip-packages}
cd /data/ragflow-offline


# 拉取并保存所有所需镜像
docker pull elasticsearch:8.11.3
#infinity和elasticsearch可以二选一下载
docker pull infiniflow/infinity:v0.6.0-dev3
#8+版本的mysql才支持向量数据
docker pull mysql:8.0.39
docker pull quay.io/minio/minio:RELEASE.2023-12-20T01-00-02Z
docker pull valkey/valkey:8

当使用sudo docker save时,虽然docker命令以root权限执行,但输出重定向操作(>)仍受当前用户目录权限限制。需要确保操作路径有足够权限,所以要先通过以下命令给足够的权限。

sudo chmod 777 /data/ragflow-offline/docker-images  # 临时放宽权限

再执行下面的保存命令

sudo docker save elasticsearch:8.11.3 > docker-images/elasticsearch-8.11.3.tar
sudo docker save infiniflow/infinity:v0.6.0-dev3 > docker-images/infinity-v0.6.0-dev3.tar
sudo docker save mysql:8.0.39 > docker-images/mysql-8.0.39.tar
sudo docker save quay.io/minio/minio:RELEASE.2023-12-20T01-00-02Z > docker-images/minio-2023-12-20.tar
sudo docker save valkey/valkey:8 > docker-images/valkey-8.tar


二、下载Ragflow

1、下载RagFlow,github上可能很慢,找一个gitee上的地址

cd /data
sudo git clone https://gitee.com/da_xu/ragflow.git
cd ragflow

2、配置python虚拟环境,如果已有请跳过

#安装venv
sudo apt install python3.12-venv
# 创建虚拟环境
sudo python3 -m venv .venv
#激活虚拟环境
source .venv/bin/activate
#安装所需要的依赖,可能会遇到很多版本问题,比如我是python3.12,要提示修改一些依赖版本
pip install -r requirements.txt

需要修改的依赖版本如下:

Pillow=10.3.0修改为11.1.0
torch=2.3.0修改为2.3.1

torch直接安装大概有800多M,看网络情况可能会超时,所以我直接选择先下载,下载地址:


https://download.pytorch.org/whl,找到你合适的版本

或者从阿里巴巴的镜像下载:
https://mirrors.aliyun.com/pypi/simple

然后使用以下命令安装

#下载
sudo wget https://download.pytorch.org/whl/cpu/torch-2.3.1%2Bcpu-cp312-cp312-linu
x_x86_64.whl#sha256=2141a6cb7021adf2f92a0fd372cfeac524ba460bd39ce3a641d30a561e41f69a
#安装torch
pip install torch-2.3.1+cpu-cp312-cp312-linux_x86_64.whl

以上可能会出现没有权限的问题,如下报错:

Installing collected packages: mpmath, typing-extensions, sympy, networkx, MarkupSafe, fsspec, filelock, jinja2, torch ERROR: Could not install packages due to an OSError: [Errno 13] Permission denied: '/data/ragflowd/.venv/lib/python3.12/site-packages/mpmath' Check the permissions.

解决方式如下:

# 进入虚拟环境上级目录
cd /data/ragflow

# 递归修改虚拟环境目录所有权(替换 <your_username> 为实际用户名)
sudo chown -R <your_username>:<your_group> .venv

# 赋予读写执行权限
sudo chmod -R 755 .venv

#或者如下操作
# 确保 /data/ragflow 目录允许当前用户操作
sudo chown -R $USER:$USER /data/ragflow
sudo chmod -R 755 /data/ragflow
#然后重新安装torch
pip install torch-2.3.1+cpu-cp312-cp312-linux_x86_64.whl

如果再遇到安装超时的问题,就采用以上方式先下载whl文件,然后单独安装,然后再安装其它的依赖。

比如又碰到160M的xgboost无法安装,如图操作:


其它比较大的whl下载:

sudo wget https://mirrors.aliyun.com/pypi/packages/67/ca/f42388aed0fddd64ade7493dbba36e1f534d4e6fdbdd355c6a90030ae028/nvidia_nccl_cu12-2.26.2-py3-none-manylinux2014_x86_64.manylinux_2_17_x86_64.whl#sha256=694cf3879a206553cc9d7dbda76b13efaf610fdb70a50cba303de1b0d1530ac6

sudo wget https://mirrors.aliyun.com/pypi/packages/92/0f/a6eeabc9d4f3dffa52d629ba2aedce3c3953a49340a65ef49be85eb26cc1/Aspose.Slides-25.2.0-py3-none-manylinux1_x86_64.whl#sha256=d60bacea1fd43d09ae1351e7a1a1c0790ff80ca7955ceb95823e47f6b39f6b91

三、打包.venv中已下载的包到pip-packages文件夹中

# 在本地开发环境执行
cd /data/ragflow
sudo tar czvf /data/ragflow-offline/pip-packages/venv.tar.gz .venv/

四、离线环境部署步骤

1. 传输离线资源到目标服务器

将以下目录复制到目标服务器/data/ragflow_inner:

sudo mkdir /data/ragflow_inner
cd /data/ragflow_inner
sudo cp -r /data/ragflow-offline/docker-images/ .
sudo cp -r /data/ragflow-offline/pip-packages/ .

2. 加载Docker镜像

cd /data/ragflow_inner
for img in docker-images/*.tar; do
    docker load -i $img
done

3. 恢复Python虚拟环境

# 解压已有虚拟环境
sudo tar xzvf pip-packages/venv.tar.gz -C /data/ragflow_inner/

4、优化配置

新的docker-compose.yml

services:
  elasticsearch:
    image: elasticsearch:8.11.3
    pull_policy: never
    environment:
      - discovery.type=single-node
      - ES_JAVA_OPTS=-Xms4g -Xmx4g
    volumes:
      - /data/ragflow_inner/data/elasticsearch:/usr/share/elasticsearch/data
    ports:
      - "9200:9200"
    healthcheck:
      test: ["CMD-SHELL", "curl --silent --fail localhost:9200/_cluster/health || exit 1"]

  infinity:
    image: infiniflow/infinity:v0.6.0-dev3
		pull_policy: never
    ports:
      - "8088:8088"
    depends_on:
      elasticsearch:
        condition: service_healthy

  mysql:
    image: mysql:8.0.39
		pull_policy: never
    environment:
      MYSQL_ROOT_PASSWORD: ragflow@2024
      MYSQL_DATABASE: ragflow
    volumes:
      - /data/ragflow_inner/data/mysql:/var/lib/mysql
    ports:
      - "3306:3306"
    healthcheck:
      test: ["CMD", "mysqladmin", "ping", "-h", "localhost"]

  minio:
    image: quay.io/minio/minio:RELEASE.2023-12-20T01-00-02Z
    pull_policy: never
    command: server /data --console-address ":9001"
    volumes:
      - /data/ragflow_inner/data/minio:/data
    ports:
      - "9000:9000"
      - "9001:9001"
    environment:
      MINIO_ROOT_USER: ragflowadmin
      MINIO_ROOT_PASSWORD: ragflow@minio

  valkey:
    image: valkey/valkey:8
		pull_policy: never
    ports:
      - "6379:6379"
    volumes:
      - /data/ragflow_inner/data/valkey:/data

  server:
    image: infiniflow/ragflow:0.17.2
		pull_policy: never
    environment:
      DB_HOST: mysql
      DB_PORT: 3306
      DB_NAME: ragflow
      DB_USER: root
      DB_PASSWORD: ragflow@2024
      MINIO_ENDPOINT: minio:9000
      MINIO_ACCESS_KEY: ragflowadmin
      MINIO_SECRET_KEY: ragflow@minio
      HF_ENDPOINT: ""  # 显式声明空变量避免警告
      MACOS: ""        # 同上
    volumes:
      - /data/ragflow_inner/logs:/app/logs
      - /data/ragflow_inner/models:/app/models
      - /data/ragflow_inner/.venv:/opt/venv  # 挂载已有虚拟环境
    ports:
      - "8000:8000"
    depends_on:
      mysql:
        condition: service_healthy
      minio:
        condition: service_started
      valkey:
        condition: service_started

5. 启动服务

# 创建数据目录
sudo mkdir -p /data/ragflow_inner/data/{elasticsearch,mysql,minio,valkey}

# 设置文件权限
sudo chmod -R 777 /data/ragflow_inner/data

# 启动所有服务
cd /data/ragflow_inner/docker
sudo docker compose -f docker-compose.yml up -d

#验证服务,输出如下图
sudo docker compose ps
sudo docker exec -it ragflow-server bash
source .venv/bin/activate


相关推荐

Linux gron 命令使用详解(linux gminer)

简介gron是一个独特的命令行工具,用于将JSON数据转换为离散的、易于grep处理的赋值语句格式。它的名字来源于"grepableon"或"grepable...

【Linux】——从0到1的学习,让你熟练掌握,带你玩转Linu

学习Linux并掌握Java环境配置及SpringBoot项目部署是一个系统化的过程,以下是从零开始的详细指南,帮助你逐步掌握这些技能。一、Linux基础入门1.安装Linux系统选择发行版:推荐...

Linux常用的shell命令汇总(linux中shell的作用)

本文介绍Linux系统下常用的系统级命令,包括软硬件查看、修改命令,有CPU、内存、硬盘、网络、系统管理等命令。说明命令是在Centos6.464位的虚拟机系统进行测试的。本文介绍的命令都会在此C...

零成本搭建个人加密文件保险柜(适用于 Win11 和 Linux)

不依赖收费软件操作简单,小白也能跟着做支持双系统,跨平台使用实现数据加密、防删除、防泄露内容通俗无技术门槛,秒懂秒用使用工具简介我们将使用两个核心工具:工具名用途系统支持Veracrypt创建加密虚...

如何在 Linux 中使用 Gzip 命令?(linux怎么用gzip命令)

gzip(GNUzip)是Linux系统中一个开源的压缩工具,用于压缩和解压缩文件。它基于DEFLATE算法,广泛应用于文件压缩、备份和数据传输。gzip生成的文件通常带有.gz后缀,压缩效率...

Linux 必备的20个核心知识点(linux内核知识点)

学习和使用Linux所必备的20个核心知识点。这些知识点涵盖了从基础操作到系统管理和网络概念,是构建扎实Linux技能的基础。Linux必备的20个知识点1.Linux文件系统层级标...

谷歌 ChromeOS 已支持 7z、iso、tar 文件格式

IT之家6月21日消息,谷歌ChromeOS在管理文件方面进行了改进,新增了对7z、iso和tar等格式的支持。从5月的ChromeOS101更新开始,ChromeOS...

如何在 Linux 中提取 Tar Bz2 文件?

在深入解压方法之前,我们先来了解.tar.bz2文件的本质。.tar.bz2是一种组合文件格式,包含两个步骤:Tar(TapeArchive):tar是一种归档工具,用于将多个文件或目录打包...

如何在 CentOS 7/8 上安装 Kitematic Docker 管理器

Kitematic是一款流行的Docker图形界面管理平台,适用于Ubuntu、macOS和Windows操作系统。然而,其他发行版(如CentOS、OpenSUSE、Fedora、R...

Nacos3.0重磅来袭!全面拥抱AI,单机及集群模式安装详细教程!

之前和大家分享过JDK17的多版本管理及详细安装过程,然后在项目升级完jdk17后又发现之前的注册和配置中心nacos又用不了,原因是之前的nacos1.3版本的,版本太老了,已经无法适配当前新的JD...

爬虫搞崩网站后,程序员自制“Zip炸弹”反击,6刀服务器成功扛住4.6万请求

在这个爬虫横行的时代,越来越多开发者深受其害:有人怒斥OpenAI的爬虫疯狂“偷”数据,7人团队十年心血的网站一夜崩溃;也有人被爬虫逼到极限,最后只好封掉整个巴西的访问才勉强止血。但本文作者却走...

Ubuntu 操作系统常用命令详解(ubuntu必学的60个命令)

UbuntuLinux是一款流行的开源操作系统,广泛应用于服务器、开发、学习等场景。命令行是Ubuntu的灵魂,也是高效、稳定管理系统的利器。本文按照各大常用领域,详细总结Ubuntu必学...

Linux面板8.0.54 测试版-已上线(linux主机面板)

Linux面板8.0.54测试版【增加】[网站]Java项目新增刷新列表按钮【增加】[网站]PHP项目-Apache-服务新增守护进程功能【增加】[网站]Python项目创建/删除网站时新增同时创建...

开源三剑客——构建私有云世界的基石

公共云原生的浪潮正在席卷这个世界,亚马逊AWS、谷歌GCP和微软的Azure年收入增长超过了30%,越来越多的公司和个人开始将自己的服务部署到云环境中,大型数据中心的规模经济带来了成本的降低,可以在保...

2.2k star,一款业界领先的私有云+在线文档管理系统

简介kodbox可道云(原KodExplorer)是业内领先的企业私有云和在线文档管理系统,为个人网站、企业私有云部署、网络存储、在线文档管理、在线办公等提供安全可控,简便易用、可高度定制的私有云产品...