[2603.07131] डोमेन-विशिष्ट ज्ञान के साथ रेटिनल वीएलएम की एंकरिंग के लिए डीप एक्सपर्ट इंजेक्शन

March 20, 2026 9:55 am 0

[Submitted on 7 Mar 2026 (v1), last revised 19 Mar 2026 (this version, v3)]

शुआई लू और 8 अन्य लेखकों द्वारा डोमेन-विशिष्ट ज्ञान के साथ रेटिनल वीएलएम की एंकरिंग के लिए डीप एक्सपर्ट इंजेक्शन नामक पेपर का एक पीडीएफ देखें।

पीडीएफ देखें
HTML (प्रयोगात्मक)

अमूर्त:बड़े विज़न लैंग्वेज मॉडल (एलवीएलएम) स्वचालित नेत्र निदान के लिए अपार संभावनाएं दिखाते हैं। हालाँकि, डोमेन-विशिष्ट ज्ञान की कमी के कारण उनकी नैदानिक तैनाती गंभीर रूप से बाधित है। इस कार्य में, हम विश्वसनीय चिकित्सा तर्क में बाधा डालने वाली दो संरचनात्मक कमियों की पहचान करते हैं: 1) परसेप्शन गैप, जहां सामान्य-उद्देश्य दृश्य एनकोडर सूक्ष्म रोग संबंधी संकेतों (उदाहरण के लिए, माइक्रोएन्यूरिज्म) को हल करने में विफल होते हैं; और 2) रीज़निंग गैप, जहां गहरे ट्रांसफार्मर परतों में बड़े पैमाने पर भाषा के पुजारियों द्वारा विरल दृश्य साक्ष्य को उत्तरोत्तर ओवरराइड किया जाता है, जिससे आधारहीन मतिभ्रम होता है। इन अंतरालों को पाटने के लिए, हम EyExIn का प्रस्ताव करते हैं, जो एक डेटा-कुशल ढांचा है जो डीप एक्सपर्ट इंजेक्शन तंत्र के माध्यम से विशेषज्ञ ज्ञान के साथ रेटिनल वीएलएम को एंकर करने के लिए डिज़ाइन किया गया है। हमारा आर्किटेक्चर एक एक्सपर्ट-अवेयर डुअल-स्ट्रीम एन्कोडिंग रणनीति को नियोजित करता है जो दृश्य प्रतिनिधित्व को शारीरिक संदर्भ के लिए एक सामान्य स्ट्रीम और पैथोलॉजिकल शब्दार्थ के लिए एक विशेष विशेषज्ञ स्ट्रीम में विभाजित करता है। उच्च-निष्ठा एकीकरण सुनिश्चित करने के लिए, हम एक सिमेंटिक-एडेप्टिव गेटेड फ़्यूज़न मॉड्यूल डिज़ाइन करते हैं, जो अप्रासंगिक पृष्ठभूमि शोर को फ़िल्टर करते हुए सूक्ष्म घाव संकेतों को गतिशील रूप से बढ़ाता है। इसके अलावा, हम फ़्यूज्ड विज़ुअल सुविधाओं को अवशिष्ट पूर्वाग्रहों के रूप में सीधे मध्यवर्ती एलएलएम परतों में एकीकृत करके लगातार “विज़न एंकर” को एम्बेड करने के लिए एडेप्टिव डीप एक्सपर्ट इंजेक्शन पेश करते हैं। यह तंत्र एक दृश्य शॉर्टकट बनाता है जो तर्क स्टैक को दृश्य साक्ष्य पर सख्ती से आधारित रहने के लिए मजबूर करता है। चार बेंचमार्क पर व्यापक प्रयोगों से पता चलता है कि हमारा मॉडल लगातार बड़े स्वामित्व वाले सिस्टम से बेहतर प्रदर्शन करता है। EyExIn डोमेन-विशिष्ट ज्ञान एम्बेडिंग को महत्वपूर्ण रूप से बढ़ाता है और भरोसेमंद नेत्र संबंधी एआई के विकास को आगे बढ़ाते हुए नेत्र दृश्य प्रश्न उत्तर में अत्याधुनिक सटीकता प्राप्त करता है।

सबमिशन इतिहास

प्रेषक: शुआई लू [view email]
[v1]

शनिवार, 7 मार्च 2026 09:43:49 यूटीसी (734 केबी)
[v2]

मंगल, 10 मार्च 2026 05:28:24 यूटीसी (732 केबी)
[v3]

गुरु, 19 मार्च 2026 08:24:18 यूटीसी (732 केबी)

THE POST RECOMMENDS

मल्टी-एजेंट इनर डायलॉग के साथ इमर्सिव साइकोलॉजिकल हीलिंग की ओर

News Source - September 13, 2025

<Submitted on 27 Feb 2025 (v1), last revised 11 Sep 2025 (this version, v2)> यूजिया चेन और 8 अन्य लेखकों द्वारा मल्टी-एजेंट इनर डायलॉग के ... Read More

वीआईसीओ: सिमेंटिक अवेयर डायनेमिक हाई-रिज़ॉल्यूशन की दिशा में एक प्रशिक्षण रणनीति

News Source - October 15, 2025

arXiv:2510.12793v1 घोषणा प्रकार: नया सार: मौजूदा मल्टीमॉडल लार्ज लैंग्वेज मॉडल (एमएलएलएम) छवि इनपुट द्वारा पेश किए गए अतिरिक्त विज़न टोकन के कारण बढ़ी हुई अनुमान ... Read More

स्केच प्रतिनिधित्व सीखने के लिए अस्थायीता पर

News Source - December 4, 2025

arXiv:2512.04007v1 घोषणा प्रकार: नया सार: रेखाचित्र जटिल दृश्यों और वास्तविक दुनिया की वस्तुओं के सरल मानव हाथ से तैयार किए गए अमूर्त हैं। यद्यपि स्केच ... Read More

खबरे

जोनाथन व्हीटली: एस्टन मार्टिन से संपर्क के बीच ऑडी बॉस तत्काल प्रभाव से चले गए

बड़े सपने देखें – सीमाओं से परे एक यात्रा | यह मीडिया कलाकृति प्रदर्शनी…

स्कूप: सलमान खान का लक्ष्य 2027 में दिल राजू और वामशी की एक्शन एंटरटेनर के साथ ईद पर वापसी करना है: बॉलीवुड समाचार

मोहम्मद दीपक पर प्रतिबंध लगाने का आदेश: HC ने जिम मालिक के खिलाफ FIR रद्द करने से इनकार किया | भारत समाचार

एचआईवी आबादी के लिए सहायता कटौती उतनी गंभीर क्यों नहीं थी जितनी भविष्यवाणी की गई थी: एनपीआर