• 文档 >
  • ExecuTorch Llama iOS 演示应用程序
快捷方式

ExecuTorch Llama iOS 演示应用程序

亲身体验在您的 iOS 设备上原生运行通过 ExecuTorch 导出的 LLaMA 和 LLaVA 模型!

点击下方图片查看实际效果!

iOS app running a LlaMA model

要求

  • Xcode 15.0 或更高版本

  • Cmake 3.19 或更高版本

    • 下载并打开 macOS 的 .dmg 安装程序,然后将 Cmake 应用程序移动到 /Applications 文件夹。

    • 安装 Cmake 命令行工具:sudo /Applications/CMake.app/Contents/bin/cmake-gui --install

  • 一个具有 increased-memory-limit 权限的开发 provisioning profile。

模型

HuggingFace 下载已导出的 LLaMA/LLaVA 模型及分词器,或者自行导出由 XNNPACKMPS 后端加速的模型。

构建并运行

  1. 确保 git 子模块是最新的

    git submodule update --init --recursive
    
  2. 打开 Xcode 项目

    open examples/demo-apps/apple_ios/LLaMA/LLaMA.xcodeproj
    
  3. 点击运行按钮,在模拟器中启动应用程序。

  4. 要在设备上运行,请确保已将其设置为开发模式,并且具有 increased-memory-limit 权限的 provisioning profile。更新应用程序的 bundle identifier 以匹配具有所需功能的 provisioning profile。

  5. 成功启动应用程序后,将导出的 ExecuTorch 模型 (.pte) 和分词器 (.model) 文件复制到 iLLaMA 文件夹中。

    • 对于模拟器:将两个文件拖放到模拟器窗口中,并将其保存在 On My iPhone > iLLaMA 文件夹中。

    • 对于设备:打开一个单独的 Finder 窗口,导航到“文件”标签页,将两个文件拖放到 iLLaMA 文件夹中,然后等待复制完成。

  6. 按照应用程序的用户界面指南从本地文件系统选择模型和分词器文件,并输入提示语。

更多详细信息,请查阅在 iOS 上使用 ExecuTorch 页面。

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取面向初学者和高级开发者的深入教程

查看教程

资源

查找开发资源并获取问题解答

查看资源