तथ्यात्मक ज्ञान स्मरण पर परिमाणीकरण के प्रभाव की जांच

January 6, 2026 10:25 am 0

[Submitted on 20 May 2025 (v1), last revised 1 Jan 2026 (this version, v2)]

थ्रू ए कंप्रेस्ड लेंस: इन्वेस्टिगेटिंग द इम्पैक्ट ऑफ क्वांटाइजेशन ऑन फैक्चुअल नॉलेज रिकॉल शीर्षक वाले पेपर का एक पीडीएफ देखें, जिसे कियानली वांग और 7 अन्य लेखकों ने लिखा है।

पीडीएफ देखें
HTML (प्रयोगात्मक)

अमूर्त:अनुमान में तेजी लाने और बड़े भाषा मॉडल (एलएलएम) की तैनाती को सुव्यवस्थित करने के लिए परिमाणीकरण विधियों का व्यापक रूप से उपयोग किया जाता है। यद्यपि विभिन्न एलएलएम क्षमताओं पर परिमाणीकरण के प्रभावों का बड़े पैमाने पर अध्ययन किया गया है, एक महत्वपूर्ण क्षेत्र अभी भी अज्ञात है: तथ्यात्मक ज्ञान स्मरण (एफकेआर), वह प्रक्रिया जिसके द्वारा एलएलएम संग्रहीत ज्ञान तक पहुंचते हैं। इस प्रयोजन के लिए, हम दो कार्यों, ज्ञान स्मरण और अव्यक्त मल्टी-हॉप तर्क पर व्याख्या-संचालित विश्लेषण के संयोजन में, अलग-अलग बिट चौड़ाई पर तीन सामान्य परिमाणीकरण तकनीकों का उपयोग करके व्यापक प्रयोग करते हैं। हम दिखाते हैं कि परिमाणीकरण के परिणामस्वरूप आम तौर पर एलएलएम के भीतर सूचना हानि होती है, जिसके परिणामस्वरूप एफकेआर के लिए उनकी क्षमता कम हो जाती है। यह प्रभाव विशेष रूप से समान वास्तुशिल्प परिवारों के भीतर छोटे मॉडलों में बढ़ाया जाता है। हालाँकि, कम बिट परिशुद्धता पर परिमाणित मॉडल लगातार निम्न प्रदर्शन प्रदर्शित नहीं करते हैं और कभी-कभी परिमाणीकरण मॉडल एफकेआर को भी बढ़ा सकता है। हमने पाया कि BitSandBytes मूल पूर्ण-सटीक मॉडल के FKR के उच्चतम संरक्षण को प्रदर्शित करता है। मॉडलों और विधियों में परिवर्तनशीलता के बावजूद, परिमाणीकरण मामूली प्रदर्शन गिरावट का कारण बनता है और एक प्रभावी संपीड़न रणनीति बनी हुई है।

सबमिशन इतिहास

प्रेषक: कियानली वांग [view email]
[v1]

मंगल, 20 मई 2025 06:01:09 यूटीसी (1,628 केबी)
[v2]

गुरु, 1 जनवरी 2026 09:26:02 यूटीसी (1,936 केबी)

खबरे

UFC फाइट नाइट 268 के लिए मार्लन वेरा बनाम डेविड मार्टिनेज भविष्यवाणी

डोम

फ़ायरफ़ॉक्स में AI सुविधाओं को कैसे बंद करें, या जो आप चाहते हैं उसे चुनें

क्रेन ब्रिंटन द्वारा क्रांति की शारीरिक रचना

[2602.15457] इवेंट-स्तरीय संवर्द्धन के साथ IoT टाइम-सीरीज़ AD को बेंचमार्क करना

विंबलडन अगले साल लाइन जजों को एआई, इलेक्ट्रॉनिक लाइन कॉलिंग से बदल देगा

भारतीय क्रिकेटर ईशान किशन के पिता प्रणव पांडे जदयू में शामिल

मुस्कान के पीछे.एनोनिम्स लैचेलन

कैप्रल FY2025 में गिरावट: वॉल्यूम संबंधी बाधाओं के बावजूद आय में 4% की बढ़ोतरी

‘स्पीकर ऑफ द नेसेट मेडल’: पीएम मोदी को इजरायल के सर्वोच्च संसदीय सम्मान से सम्मानित किया गया | भारत समाचार

[2504.18831] पीएसआई में उच्च तीव्रता म्यूऑन बीम सुविधा पर भविष्य के $μ^+ \to \mathrm{e}^+ γ$ प्रयोग के लिए आशय पत्र

कलशी ने मिस्टरबीस्ट के संपादक पर इनसाइडर ट्रेडिंग का आरोप लगाया: एनपीआर

[2602.21182] ओपन एटॉमिक ईथरनेट के साथ सीएपी प्रमेय को दरकिनार करना

Mz-wi

तथ्यात्मक ज्ञान स्मरण पर परिमाणीकरण के प्रभाव की जांच

सबमिशन इतिहास

निराशावादी कार्डिनैलिटी आकलन के लिए उभयलिंगी डिग्री अनुक्रम सीमाएं

तार्किक तर्क और परे सीखने के लिए पैमाने पर सत्यापन योग्य तर्क डेटा को संश्लेषित करना

त्वरित इंजेक्शन स्कीमा की सुरक्षा के लिए स्वचालित सह-विकासवादी ढांचा

COMMENTS

Leave a Reply Cancel reply

पफ्लान्ज़्लिच्ट

क्रेन ब्रिंटन द्वारा क्रांति की शारीरिक रचना

बौने का चश्मा, और मैक्स साइमन नॉर्डौ द्वारा अन्य परी कथाएँ

UFC फाइट नाइट 268 के लिए मार्लन वेरा बनाम डेविड मार्टिनेज भविष्यवाणी

डोम