Do I pay twice—plan plus API?

Your Digio subscription covers infrastructure, agents, and included Digio Tokens. Managed model usage debits that token balance by actual input/output tokens. GPU rental is an add-on for the machines you control.

Can different agents use different models?

Yes—each agent can have its own default. Tasks and chats can override for a single run without changing the global default.

What is the difference between Sonnet and Opus?

Opus is tuned for harder reasoning and longer coherent plans; Sonnet is faster and cheaper for everyday agent loops. Haiku and flash-class models are best for volume subtasks.

Can I run only my own model and block cloud APIs?

Enterprise workspaces can restrict outbound model providers and route all agent traffic to your GPU endpoint. Hybrid mode is the default for most teams.

Which GPU sizes are available?

Offerings depend on region and demand—commonly 24–80 GB VRAM tiers for 7B–70B class models and multi-GPU nodes for larger stacks. We help size VRAM from your parameter count and quantization.

Does private GPU usage still consume Digio Tokens?

Orchestration (agents, tasks, storage) stays on your plan. Inference on your GPU is billed as GPU time; you may optionally meter token-shaped usage for internal chargeback.

Imprastraktura sa Digio

Mga modelo sa AI ug GPU

Pagdalag mga ahente sa gidumala nga mga modelo sa utlanan karon—o pag-abang sa kapasidad sa GPU, pag-deploy sa imong kaugalingong mga gibug-aton, ug pagruta sa mga buluhaton sa Digio ngadto sa pribadong mga endpoint sa samang workspace.

B2B SaaS website UI label. Paghubad sa natural nga ceb: Claude, GPT, Gemini Pagpili sa modelo sa matag ahente Pag-abang sa GPU ug BYOM

Paghimo workspace Mga plano ug token

Gidumala nga mga modelo

Mga modelo nga anaa sa Digio karon

Pag-assign og default nga modelo kada ahente o override kada buluhaton. Ang paggamit kay gisukod sa Digio Token gikan sa balanse sa imong plano—parehong pitaka kung ang ahente motawag sa Sonnet, GPT-4o, o Gemini Flash.

Antropiko Claude

Claude Opus 4.7 Panguna nga pangatarungan, taas nga konteksto, arkitektura ug estratehiya nga trabaho.
Claude Opus 4.6 Ang miaging henerasyon nga Opus alang sa lig-on, taas nga kalidad nga pagtuki.
Claude Sonnet 4.6 Adlaw-adlaw nga drayber—coding, pagsulat, ug multi-step agent loops.
Claude Sonnet 4.5 / 4 Ang paspas nga mga lebel sa Sonnet nga adunay dali nga pag-cache sa gisuportahan nga mga karga sa trabaho.
Claude Haiku 4.5 Ubos nga latency nga mga draft, klasipikasyon, ug taas nga volume nga mga subtask.

B2B SaaS website UI label. Paghubad sa natural nga ceb: OpenAI

GPT-5.5 / GPT-5.4 / GPT-5.2 Pinakabag-o nga pamilya sa GPT-5 alang sa kinatibuk-an ug ahente nga mga karga sa trabaho.
GPT-4.1 & GPT-4o Kasaligang multimodal nga chat ug paggamit sa himan alang sa mga ahente sa produksiyon.
GPT-4o mini Episyente sa gasto nga ruta para sa mga summary ug lightweight nga mga lakang.
o3 / o3-pro / o3-mini / o4-mini Mga modelo nga nakapunting sa pangatarungan alang sa matematika, pagplano, ug pag-verify.
GPT-5.3 Codex & Codex mini Ang paghimo sa code, mga refactor, ug mga kahanas sa ahente nga nahibal-an sa repo.

B2B SaaS website UI label. Paghubad sa natural nga ceb: Google Gemini

Gemini 2.5 Pro Long-context research ug structured extraction.
Gemini 2.5 Flash Mga lakang sa ahente nga high-throughput nga adunay kompetisyon nga mga rate sa token.
Gemini 2.0 Flash Labing paspas nga mga pass para sa pag-parse, pag-tag, ug mga batch nga trabaho.

Bukas ug espesyalista nga mga API

DeepSeek Chat & Reasoner Kusog nga bili alang sa chat ug chain-of-thought style nga mga buluhaton.
Mistral Large Opsyon nga gi-host sa Europe alang sa mga grupo sa ahente nga multilinggwahe.
Llama 3.3 70B Open-weights class model pinaagi sa API—maayong pagkapares sa pribadong GPU.
Grok 3 Real-time nga oriented nga modelo alang sa mga ahente sa balita ug sosyal nga pag-monitor.
Sonar Pro Mga tubag nga gipasukad sa pagpangita alang sa mga ahente sa panukiduki.
Command R+ RAG-friendly enterprise chat ug retrieval workflows.

Model list and token economics evolve with provider releases. Your workspace shows live options when you assign a model to an agent; Digio Tokens debit from the same balance as in pricing.

Paggamit

Giunsa pagpili sa mga ahente ang usa ka modelo

Mahimong irekomenda sa Coordinator ang Sonnet vs Opus vs usa ka mas barato nga modelo sa flash base sa klase sa buluhaton. Ang mga tiggamit sa gahum nagtakda sa mga default matag papel sa ahente-panukiduki sa Sonnet, katapusan nga pagrepaso sa Opus, daghang pag-tag sa Haiku o Gemini Flash.

Per agent — default model in agent settings; override in To do or chat when needed.
Metered fairly — input, output, and cached tokens map to Digio Token charges (see usage in your wallet).
Skills stay the same — tools and integrations work across models; only latency and cost profile change.
Plan limits — more agents and monthly Digio Tokens on higher tiers; top up anytime on the pricing page.

Pag-abang sa GPU

Pag-abang sa GPU ug pagdagan ang imong kaugalingon nga mga modelo

Kinahanglan ang usa ka maayo nga tune, usa ka checkpoint nga adunay hangin, o matag-an nga pagpresyo sa inference? Idugang ang gipahinungod nga kapasidad sa GPU sa imong Digio workspace, i-install ang serving stack nga gusto nimo, ug itudlo ang mga ahente sa imong pribadong endpoint.

Gipahinungod nga mga higayon

Inoras o binulan nga mga GPU node (A100, H100, L40S nga klase) nga gilakip sa imong tenant—nahimulag sa ubang mga kustomer.

Ang imong mga gibug-aton

Pag-upload ug mga safetensor, GGUF, o pagbitad gikan sa imong rehistro; pagpadagan sa Llama, Mistral, Qwen, ug naandan nga mga tono.

Standard nga pagserbisyo

Ang vLLM, TGI, Ollama, o mga container nga mga imahe nga imong gipadayon—gitawag sa mga ahente sa Digio ang usa ka OpenAI-compatible nga base URL.

Parehas nga orkestra

Ang buhaton, ang chat sa team, kahanas, ug kolaborasyon nga wala mausab-imo ra ang inference backend.

Hybrid nga ruta

Ipadala ang sensitibo nga mga lakang sa pribadong GPU ug gamita ang Claude o GPT alang sa publikong panukiduki sa usa ka workflow.

Mga kontrol sa negosyo

VPC peering, static egress, audit logs, ug model allowlists para sa regulated teams.

Pagdala sa imong kaugalingon nga modelo

Pag-instalar ug pagkonektar sa usa ka naandan nga modelo

Kasagaran nga pag-setup gikan sa zero hangtod sa mga ahente nga nagtawag sa imong endpoint:

B2B SaaS website UI label. Paghubad sa natural ceb: Reserve GPU

Pilia ang VRAM, rehiyon, ug uptime (burst vs always-on). Ang pagtipig alang sa mga gibug-aton ipadala uban ang pananglitan o i-mount ang imong balde.
I-deploy ang stack

Pagsugod sa usa ka nagsilbi nga imahe o SSH sa, pag-install sa mga drayber sa CUDA, ug pagkarga sa mga checkpoint. Ang mga pagsusi sa kahimsog nagpamatuod nga andam na ang modelo.
Pagrehistro sa katapusan nga punto

Idugang ang base URL, API key, ug model id sa mga setting sa workspace. Gi-validate sa Digio ang latency ug format sa token sa dili pa mag-live.
I-assign sa mga ahente

Pilia ang imong pribado nga modelo isip default alang sa pinili nga mga ahente; ang gidumala nga mga modelo sa Claude/GPT nagpabilin nga magamit sa kilid.

Ang pag-abang sa GPU gilain-lain gikan sa mga subskripsyon sa plano sa Digio. Kontaka kami alang sa pagplano sa kapasidad, mga SLA, ug paglalin gikan sa naglungtad nga cluster sa inference.

B2B SaaS website UI label. Paghubad sa natural nga ceb: FAQ

Mga modelo ug pangutana sa GPU

Pagpili sa gidumala nga mga API kumpara sa self-hosted inference sa Digio.

Kaduha ba ko mobayad—plan plus API?

Ang imong suskrisyon sa Digio naglangkob sa imprastraktura, ahente, ug gilakip ang Digio Token. Gidumala nga modelo sa paggamit sa mga debit nga token balanse pinaagi sa aktuwal nga input/output token. Ang pag-abang sa GPU usa ka add-on alang sa mga makina nga imong gikontrol.

Mahimo bang magamit sa lainlaing mga ahente ang lainlaing mga modelo?

Oo—ang matag ahente mahimong adunay kaugalingong default. Ang mga buluhaton ug mga chat mahimong ma-override sa usa ka run nga dili usbon ang global default.

Unsa ang kalainan tali sa Sonnet ug Opus?

Ang Opus gipunting alang sa mas lisud nga pangatarungan ug mas taas nga managsama nga mga plano; Ang Sonnet mas paspas ug mas barato alang sa adlaw-adlaw nga mga loop sa ahente. Ang mga modelo sa Haiku ug flash-class labing maayo alang sa mga subtask sa volume.

Mahimo ba nako ang akong kaugalingon nga modelo ug i-block ang mga cloud API?

Ang mga workspace sa negosyo makapugong sa mga outbound model providers ug makaruta sa tanang trapiko sa ahente ngadto sa imong GPU endpoint. Ang hybrid mode mao ang default alang sa kadaghanan sa mga team.

Unsang mga gidak-on sa GPU ang magamit?

Ang mga tanyag nagdepende sa rehiyon ug panginahanglan—kasagarang 24–80 GB nga mga tier sa VRAM alang sa 7B–70B nga mga modelo sa klase ug multi-GPU node alang sa mas dagkong mga stack. Gitabangan namo ang gidak-on sa VRAM gikan sa imong parameter count ug quantization.

Ang paggamit ba sa pribado nga GPU nagkonsumo pa ba sa Digio Token?

Ang orkestrasyon (mga ahente, mga buluhaton, pagtipig) magpabilin sa imong plano. Ang inference sa imong GPU gisingil isip oras sa GPU; mahimo nimo nga opsyonal nga metrohan ang pormag token nga paggamit alang sa internal chargeback.

Susihon si Digio

Ibutang ang mga modelo sa pagtrabaho

Mga ahente, buluhaton, ug kahanas—ang workspace sa palibot sa modelo nga imong gipili.

Pilia ang gidumala nga mga modelo o dad-a ang imong GPU

Sugdi sa Claude ug GPT karon, unya idugang ang gipahinungod nga GPU kung andam ka na nga mag-host sa naandan nga mga gibug-aton-parehas nga mga ahente, parehas nga mga buluhaton, imong nahibal-an.

Pagsugod Itandi ang mga plano