[2509.19185] ओपन सोर्स एआई एजेंट फ्रेमवर्क और एजेंटिक एप्लिकेशन में परीक्षण प्रथाओं का एक अनुभवजन्य अध्ययन

September 25, 2025 6:53 pm 0

[Submitted on 23 Sep 2025 (v1), last revised 24 Sep 2025 (this version, v2)]

मोहम्मद मेहेदी हसन और हाओ ली और इमाद फालाहजादेह और गोपी कृष्णन राजबाहदुर और ब्राम एडम्स और अहमद ई। हसन द्वारा ओपन सोर्स एआई एजेंट फ्रेमवर्क और एजेंटिक अनुप्रयोगों में परीक्षण प्रथाओं के एक अनुभवजन्य अध्ययन के एक पीडीएफ को देखें।

पीडीएफ देखें
एचटीएमएल (प्रयोगात्मक)

अमूर्त:फाउंडेशन मॉडल (एफएम) -बेड एआई एजेंट तेजी से विविध डोमेन में गोद ले रहे हैं, लेकिन उनके अंतर्निहित गैर-डिलेक्टिज़्म और गैर-प्रजनन योग्यता मुद्रा परीक्षण और गुणवत्ता आश्वासन चुनौतियों का सामना करना पड़ रहा है। जबकि हाल के बेंचमार्क कार्य-स्तरीय मूल्यांकन प्रदान करते हैं, इस बात की सीमित समझ है कि डेवलपर्स विकास के दौरान इन एजेंटों की आंतरिक शुद्धता को कैसे सत्यापित करते हैं।

इस अंतर को संबोधित करने के लिए, हम एआई एजेंट पारिस्थितिकी तंत्र में परीक्षण प्रथाओं के पहले बड़े पैमाने पर अनुभवजन्य अध्ययन का संचालन करते हैं, 39 ओपन-सोर्स एजेंट फ्रेमवर्क और 439 एजेंटिक अनुप्रयोगों का विश्लेषण करते हैं। हम दस अलग-अलग परीक्षण पैटर्न की पहचान करते हैं और पाते हैं कि उपन्यास, एजेंट-विशिष्ट तरीकों जैसे डीपवेल का उपयोग शायद ही कभी किया जाता है (लगभग 1%), जबकि पारंपरिक पैटर्न जैसे नकारात्मक और सदस्यता परीक्षण को व्यापक रूप से एफएम अनिश्चितता का प्रबंधन करने के लिए अनुकूलित किया जाता है। एजेंट फ्रेमवर्क और एजेंटिक अनुप्रयोगों के कैनोनिकल आर्किटेक्चरल घटकों के लिए इन पैटर्नों को मैप करके, हम परीक्षण प्रयास के एक मौलिक व्युत्क्रम को उजागर करते हैं: संसाधन कलाकृतियों (उपकरण) और समन्वय कलाकृतियों (वर्कफ़्लो) जैसे नियतात्मक घटक परीक्षण के 70% से अधिक का उपभोग करते हैं, जबकि एफएम-आधारित योजना शरीर 5% से कम प्राप्त करता है। गंभीर रूप से, यह एक महत्वपूर्ण अंधा स्थान को प्रकट करता है, क्योंकि ट्रिगर घटक (संकेत) उपेक्षित रहता है, सभी परीक्षणों के लगभग 1% में दिखाई देता है।

हमारे निष्कर्ष एफएम-आधारित एजेंट फ्रेमवर्क और एजेंटिक अनुप्रयोगों में पहला अनुभवजन्य परीक्षण बेसलाइन प्रदान करते हैं, जो गैर-नियतावाद के लिए एक तर्कसंगत लेकिन अपूर्ण अनुकूलन का खुलासा करते हैं। इसे संबोधित करने के लिए, फ्रेमवर्क डेवलपर्स को उपन्यास परीक्षण विधियों के लिए समर्थन में सुधार करना चाहिए, एप्लिकेशन डेवलपर्स को शीघ्र प्रतिगमन परीक्षण को अपनाना चाहिए, और शोधकर्ताओं को गोद लेने के लिए बाधाओं का पता लगाना चाहिए। इन प्रथाओं को मजबूत करना अधिक मजबूत और भरोसेमंद एआई एजेंटों के निर्माण के लिए महत्वपूर्ण है।

प्रस्तुत इतिहास

से: मोहम्मद मेहेदी हसन [view email]
[v1]

टीयू, 23 सितंबर 2025 16:02:09 यूटीसी (450 केबी)
[v2]

बुध, 24 सितंबर 2025 14:15:20 UTC (450 kb)

खबरे

किंग ने ‘बुलेटप्रूफ’ ट्रैक को लक्खे से पहले एक व्यक्तिगत मील का पत्थर बताया: बॉलीवुड समाचार

टेस्ला टेराफैब परियोजना के लिए ताइवान चिप इंजीनियरों की तलाश कर रही है

सरकार ने ‘नारी’ को ‘नारा’ बना दिया है: अखिलेश यादव | भारत समाचार

[2507.12575] मेटास्टेबल अवस्थाओं का आकार अनुकूलन

वायर्ड लव: ए रोमांस ऑफ डॉट्स एंड डैश, एला चीवर थायर द्वारा

इस सप्ताह विज्ञान में: छोटी-छोटी बातें, अधिक मानव झींगा मछली की हत्या, और एक प्राचीन बाढ़

[2604.13994] असंतुलित बनावट के लिए रिमोट सेंसिंग छवि सुपर-रिज़ॉल्यूशन: एक बनावट-जागरूक प्रसार ढांचा

एंटोनी सेमेन्यो: मैन सिटी फॉरवर्ड ने नस्लीय दुर्व्यवहार पर प्रकाश डाला

IMG_5571 ओलाफ

‘तमिलनाडु लड़ेगा’: सीएम स्टालिन ने परिसीमन में उत्तर की बढ़त पर पीएम मोदी को दी चेतावनी | भारत समाचार

द रेड एंड द ब्लैक: ए क्रॉनिकल ऑफ़ 1830 स्टेंडल द्वारा

ओपनएआई सीईओ पर हमले के आरोपी व्यक्ति पर हत्या के प्रयास का आरोप: एनपीआर

आज्ञाकारी लेकिन असंतोषजनक: संभाव्य जीनोटाइपिंग सॉफ़्टवेयर के लिए ऑडिटिंग मानकों और प्रथाओं के बीच का अंतर

हॉकी झारखंड 14वीं हॉकी इंडिया जूनियर महिला राष्ट्रीय चैम्पियनशिप 2024 का चैंपियन बना

IMG_5569 ओलाफ

92 वर्षीय आशा भोसले को कार्डियक अरेस्ट के बाद अस्पताल में भर्ती कराया गया: रिपोर्ट: बॉलीवुड समाचार

सीजफ़ायर न्यूज़ पर सीगेट और सैंडिस्क स्टॉक में उछाल आया। क्या आपको अभी मेमोरी स्टॉक खरीदना चाहिए?

[2509.19185] ओपन सोर्स एआई एजेंट फ्रेमवर्क और एजेंटिक एप्लिकेशन में परीक्षण प्रथाओं का एक अनुभवजन्य अध्ययन

प्रस्तुत इतिहास

तार्किक तर्क और परे सीखने के लिए पैमाने पर सत्यापन योग्य तर्क डेटा को संश्लेषित करना

सहजता या विशिष्टता के बिना पैरामीट्रिक निश्चित अनुकूलन के लिए सहायक राज्य विधि

[2602.15457] इवेंट-स्तरीय संवर्द्धन के साथ IoT टाइम-सीरीज़ AD को बेंचमार्क करना

COMMENTS

Leave a Reply Cancel reply

कार्तल जीत और रेडुकानू और बाउल्टर टीम के रूप में महिलाओं को रानी के लिए लौटते हैं

रणवीर शोर ने सलमान खान के दावों को छोड़ दिया: “वह एक बहुत ही उदार इंसान है”: बॉलीवुड न्यूज

किंग ने ‘बुलेटप्रूफ’ ट्रैक को लक्खे से पहले एक व्यक्तिगत मील का पत्थर बताया: बॉलीवुड समाचार

टेस्ला टेराफैब परियोजना के लिए ताइवान चिप इंजीनियरों की तलाश कर रही है

सरकार ने ‘नारी’ को ‘नारा’ बना दिया है: अखिलेश यादव | भारत समाचार