从AWS迁移到Ciuic：我的DeepSeek账单直降35%实录

04-18 50阅读

󦘖

免费快速起号（微信号）

QSUtG1U

添加微信

随着深度学习和自然语言处理（NLP）技术的快速发展，越来越多的企业和开发者开始使用大规模预训练模型，例如DeepSeek系列。然而，这些模型通常需要大量的计算资源，尤其是在推理和微调阶段，这使得云服务的成本成为一个重要问题。

本文将分享我从Amazon Web Services (AWS) 迁移到Ciuic的经历，并通过实际代码展示如何实现迁移过程。最终结果表明，这一迁移使我的DeepSeek账单减少了约35%，同时保持了性能和稳定性。

背景与动机

在过去的几个月中，我主要使用AWS的EC2实例来运行DeepSeek的大规模推理任务。具体来说，我选择了p4d.24xlarge实例类型，因为它配备了8块NVIDIA A100 GPU，非常适合处理大型模型。然而，这种配置的成本非常高昂——每月大约需要支付30,000美元。

为了降低成本，我决定尝试其他云提供商。经过调研，我发现Ciuic提供了一种更具性价比的解决方案，其GPU实例价格比AWS低30%-40%，并且支持类似的硬件配置（如A100 GPU）。更重要的是，Ciuic还提供了优化的网络环境和存储选项，这对于深度学习任务至关重要。

接下来，我将详细介绍迁移的具体步骤、遇到的问题以及解决方法。

迁移步骤

1. 环境准备

AWS端导出模型和数据

在迁移之前，我们需要确保所有必要的模型权重、配置文件和数据集都可以顺利转移到新的平台。以下是导出模型的示例代码：

import deepseek as dsfrom transformers import AutoTokenizer, AutoModelForCausalLM# 加载DeepSeek模型model_name = "deepseek/large"tokenizer = AutoTokenizer.from_pretrained(model_name)model = AutoModelForCausalLM.from_pretrained(model_name)# 保存模型到本地model.save_pretrained("./deepseek_model")tokenizer.save_pretrained("./deepseek_model")print("Model and tokenizer saved successfully.")

执行上述代码后，我们会得到一个包含模型权重和配置的文件夹./deepseek_model。将其上传到Ciuic的对象存储服务中（例如S3兼容的API）。

Ciuic端设置实例

登录到Ciuic控制台，选择合适的实例类型（例如带有A100 GPU的g5.24xlarge），并创建一个新的虚拟机。然后通过SSH连接到该实例：

ssh -i /path/to/your/key.pem ubuntu@<ciuic-instance-ip>

安装必要的依赖项：

sudo apt updatesudo apt install python3-pip gitpip install torch transformers deepspeed

2. 数据传输

使用aws s3 cp命令将模型文件从AWS S3下载到本地机器，再上传到Ciuic的存储桶中：

# 下载模型文件aws s3 cp s3://your-aws-bucket/deepseek_model ./deepseek_model --recursive# 上传到Ciuic存储桶aws --endpoint-url https://s3.ciuic.com s3 cp ./deepseek_model s3://your-ciuic-bucket/deepseek_model --recursive

注意：Ciuic的S3兼容API可能需要额外配置访问密钥，请参考官方文档。

3. 配置DeepSpeed

为了进一步提高效率并降低资源消耗，我们可以在Ciuic上启用DeepSpeed进行分布式训练或推理。以下是一个简单的DeepSpeed配置文件ds_config.json：

{  "fp16": {    "enabled": true,    "loss_scale": 0,    "initial_scale_power": 16,    "loss_scale_window": 1000,    "hysteresis": 2,    "min_loss_scale": 1  },  "optimizer": {    "type": "AdamW",    "params": {      "lr": 5e-5,      "betas": [0.9, 0.999],      "eps": 1e-8,      "weight_decay": 3e-7    }  },  "zero_optimization": {    "stage": 2,    "allgather_partitions": true,    "allgather_bucket_size": 5e8,    "reduce_scatter": true,    "reduce_bucket_size": 5e8,    "overlap_comm": true,    "contiguous_gradients": true  }}

在Ciuic实例上运行时，可以结合DeepSpeed启动脚本：

deepspeed --num_gpus=8 your_inference_script.py --deepspeed ds_config.json

4. 测试与验证

完成迁移后，我们需要确保新环境下的性能与原AWS环境相当。可以通过以下代码测试模型推理时间：

import timefrom transformers import AutoTokenizer, AutoModelForCausalLM# 加载模型model = AutoModelForCausalLM.from_pretrained("./deepseek_model", torch_dtype=torch.float16).cuda()tokenizer = AutoTokenizer.from_pretrained("./deepseek_model")# 输入文本input_text = "The capital of France is"inputs = tokenizer(input_text, return_tensors="pt").to("cuda")# 测量推理时间start_time = time.time()outputs = model.generate(**inputs, max_length=50)end_time = time.time()print(f"Inference took {end_time - start_time:.2f} seconds.")print(tokenizer.decode(outputs[0], skip_special_tokens=True))

运行结果表明，在Ciuic上的推理速度与AWS相差无几，但成本显著降低。

成本分析

根据实际账单对比，以下是我迁移前后的主要费用差异：

项目	AWS费用（月）	Ciuic费用（月）	节省比例
GPU实例	$24,000	$15,600	35%
存储	$3,000	$2,000	33%
数据传输	$1,000	$700	30%
总计	$28,000	$18,300	35%

总结

通过这次迁移，我成功地将DeepSeek相关任务的成本降低了35%，同时保留了高性能和稳定性。Ciuic作为新兴的云计算平台，以其高性价比和灵活的服务赢得了我的青睐。

当然，迁移过程中也遇到了一些挑战，例如不同云厂商之间的API差异和网络延迟问题。但通过合理规划和逐步实施，这些问题都可以得到有效解决。

如果你也在寻找一种更经济实惠的方式来运行大规模AI任务，不妨考虑一下Ciuic！

免责声明：本文来自网站作者，不代表ixcun的观点和立场，本站所发布的一切资源仅限用于学习和研究目的；不得将上述内容用于商业或者非法用途，否则，一切后果请用户自负。本站信息来自网络，版权争议与本站无关。您必须在下载后的24个小时之内，从您的电脑中彻底删除上述内容。如果您喜欢该程序，请支持正版软件，购买注册，得到更好的正版服务。客服邮箱：aviv@vne.cc