모바일에서 LocalLLM으로 동작하는 모바일 앱을 개발하려면 ONNX Runtime을 사용할 수 있습니다. ONNX Runtime을 사용한 모바일 AI 앱 개발 과정은 다음과 같은 단계로 진행됩니다.
- 모델 확보: 먼저, 모바일 애플리케이션의 시나리오에 적합한 ONNX 형식의 모델을 확보해야 합니다. 예를 들어 이미지 분류, 비디오 스트림에서 객체 감지, 텍스트 요약 또는 예측, 수치 예측 등을 위한 모델이 필요합니다. ONNX 모델은 ONNX 모델 줌에서 가져올 수 있으며, PyTorch, TensorFlow 등의 다른 형식의 모델을 ONNX 변환기를 사용하여 ONNX 형식으로 변환할 수 있습니다.
- 애플리케이션 개발: 모델을 확보했다면, ONNX Runtime API를 사용하여 모델을 로드하고 실행할 수 있습니다. 사용할 언어 바인딩과 런타임 패키지는 개발 환경 및 타겟 플랫폼에 따라 달라집니다.
- 애플리케이션 성능 측정: 개발된 애플리케이션의 성능을 타겟 플랫폼의 요구 사항에 따라 측정해야 합니다. 측정 항목에는 애플리케이션 바이너리 크기, 모델 크기, 애플리케이션 지연 시간, 전력 소비 등이 포함됩니다.
- 애플리케이션 최적화: 애플리케이션이 요구 사항을 충족하지 못하는 경우 최적화를 수행할 수 있습니다. 모델 크기 감소, 애플리케이션 바이너리 크기 감소, 실행 프로바이더 선택 등의 최적화 방법이 있습니다.
ONNX Runtime을 사용하여 모바일 앱을 개발하는 방법에 대한 자세한 정보는 여기에서 확인할 수 있습니다.
[광고] STEEM 개발자 커뮤니티에 참여 하시면, 다양한 혜택을 받을 수 있습니다.
Downvoting a post can decrease pending rewards and make it less visible. Common reasons:
Submit
Downvoting a post can decrease pending rewards and make it less visible. Common reasons:
Submit
안녕하세요. 오늘(2024.06.01) 기준 @jsup 2.0 후원 보팅 현황입니다.
jsup 2.0 - 업보팅을 다시 위대하게
@newiz -> @anpigon : 605.61sp
@jstst -> @anpigon : 88.85sp
@jsup에 임대하시면 매일 업보팅을 받으며, 23일후부터 매일 큐레이션/패시브 보상을 받습니다. 후원 내역이 있을 경우 임대량에 합산되어 보팅됩니다. 개발자(@joviansummer) 지원 보팅 외에 수수료가 없어 수익률도 우수합니다. 많은 관심 부탁드립니다. 감사합니다.
Downvoting a post can decrease pending rewards and make it less visible. Common reasons:
Submit