Multimodal RAG Playground 💬 輸入工地照片,生成工地場景及相關法規和缺失描述
TonTon Huang Ph.D. @ 2024/11
Deep Learning 101 Github
|
Deep Learning 101
|
台灣人工智慧社團 FB
|
YouTube
手把手帶你一起踩AI坑
|
ComfyUI + Stable Diffuision
白話文手把手帶你科普 GenAI
|
大型語言模型直接就打完收工?
什麼是大語言模型,它是什麼?想要嗎?
|
那些檢索增強生成要踩的坑
那些語音處理 (Speech Processing) 踩的坑
|
那些自然語言處理 (Natural Language Processing, NLP) 踩的坑
那些ASR和TTS可能會踩的坑
|
那些大模型開發會踩的坑
用PPOCRLabel來幫PaddleOCR做OCR的微調和標註
|
基於機器閱讀理解和指令微調的統一信息抽取框架之診斷書醫囑資訊擷取分析
圖片上傳
Drop Image Here
- or -
Click to Upload
輸入問題描述
分析一下這張工地場景照片
Clear
Submit
output
Examples
圖片上傳
輸入問題描述