news 2026/6/26 0:11:08

Meta-Llama-3.1-8B-bnb-4bit 下载加载

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Meta-Llama-3.1-8B-bnb-4bit 下载加载

Meta-Llama-3.1-8B-bnb-4bit 加载:

from huggingface_hub import InferenceClient from torch import nn from transformers import ( AutoModel, AutoProcessor, AutoTokenizer, AutoModelForCausalLM, PreTrainedTokenizer, PreTrainedTokenizerFast, BitsAndBytesConfig, ) from pathlib import Path import torch from PIL import Image import os # =============================== # CLIP (SigLIP) # # =============================== # model_id = "google/siglip-so400m-patch14-384" # CLIP_PATH = download_hg_model(model_id, "clip") # clip_processor = AutoProcessor.from_pretrained( # CLIP_PATH, # trust_remote_code=True # ) # clip_model = AutoModel.from_pretrained( # CLIP_PATH, # trust_remote_code=True # ) # clip_model = clip_model.vision_model # clip_model.eval() # clip_model.requires_grad_(False) # clip_model.to("cuda") # =============================== # LLM (LLaMA 3.1 4bit) # =============================== MODEL_PATH = "/data/lbg/models/textoon/ComfyUI/models/LLM/Meta-Llama-3.1-8B-bnb-4bit" tokenizer = AutoTokenizer.from_pretrained( MODEL_PATH, trust_remote_code=True, use_fast=True ) assert isinstance( tokenizer, (PreTrainedTokenizer, PreTrainedTokenizerFast) ), f"Tokenizer is of type {type(tokenizer)}" # ⭐ 2️⃣ bitsandbytes 4bit 配置(关键) bnb_config = BitsAndBytesConfig( load_in_4bit=True, bnb_4bit_quant_type="nf4", bnb_4bit_compute_dtype=torch.float16, bnb_4bit_use_double_quant=True, ) # ⭐ 3️⃣ 正确加载 4bit 模型 text_model = AutoModelForCausalLM.from_pretrained( MODEL_PATH, quantization_config=bnb_config, device_map="auto", trust_remote_code=True, ) text_model.eval()
pip install bitsandbytes
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/25 14:30:29

构建软件质量防线:测试缺陷的系统性预防措施

在快速迭代的软件开发环境中,缺陷发现得越晚,修复成本就呈指数级增长。研究表明,生产环境中发现的缺陷其修复成本是编码阶段发现的100倍以上。因此,现代软件测试已从单纯的缺陷检测向缺陷预防演进,致力于在缺陷产生前构…

作者头像 李华
网站建设 2026/6/25 13:59:50

构建高效可持续的自动化测试框架:从架构设计到落地实践

随着敏捷开发与DevOps实践的普及,自动化测试已成为保障软件质量的核心环节。2025年的今天,现代应用架构正朝着微服务、云原生和智能化的方向演进,这对测试框架的适应性、可维护性和扩展性提出了更高要求。一个设计良好的自动化测试框架不仅能…

作者头像 李华
网站建设 2026/6/24 2:42:05

自动化测试维护策略:构建可持续的测试资产

随着敏捷开发和DevOps实践的普及,自动化测试已成为软件质量保障的核心环节。然而,许多团队在享受自动化测试带来的效率提升时,却面临着测试用例老化、维护成本飙升、ROI持续下降的困境。据统计,超过60%的自动化测试失败并非源于产…

作者头像 李华
网站建设 2026/6/25 9:55:52

二叉树的相关知识以及代码实现(Java)

一、二叉树的定义与基本概念二叉树是一种非线性数据结构,每个节点最多包含 2 个子节点(左子节点、右子节点),核心特点:(1)每个节点的子树数量不超过 2;(2)左、…

作者头像 李华