खबरे

निराशावादी कार्डिनैलिटी आकलन के लिए उभयलिंगी डिग्री अनुक्रम सीमाएं

निराशावादी कार्डिनैलिटी आकलन के लिए उभयलिंगी डिग्री अनुक्रम सीमाएं

arXiv:2510.04249v1 घोषणा प्रकार: नया सार: एक बड़े डेटाबेस सिस्टम में, एक जॉइन क्वेरी की कार्डिनैलिटी को ऊपरी सीमा तक सीमित करना एक महत्वपूर्ण कार्य है जिसे $\textit{निराशावादी कार्डिनैलिटी आकलन}$ कहा जाता है। हाल ही में, अबो खामिस, नाकोस, ओल्टेनु और सुसीउ ने संबंधित कार्यों को निम्नलिखित कुशल ढांचे में एकीकृत किया। चरण 1: मान लीजिए कि $(X_1, \dotsc, चरण 2: शैनन-प्रकार की असमानताओं जैसे $H(X, Y, Z) \le H(X) + H(Y|X) + H(Z|Y)$ का उपयोग करके ऊपरी सीमा $H(X_1, \dotsc, X_n)$। चरण 3: किसी संबंध के अंतर्निहित ग्राफ़ के डिग्री अनुक्रम के $p$-मानदंड का उपयोग करके ऊपरी सीमा $H(X_i) + p H(X_j | X_i)$। जबकि चरण 3 में पुराने बाउंड अंतर्निहित ग्राफ़ में “पंजे $\in$” की गणना करते हैं, हमने $\textit{ambidextrous}$ बाउंड प्रस्तावित किया है जो “पंजे जोड़े ${\ni}\!{-}\!{\in}$” की गणना करता है। नई सीमाएँ संभवतः ढीली नहीं हैं और अनुभवजन्य रूप से सख्त हैं: वे $x^{3/4}$ गुना अधिक अनुमानित हैं जबकि पुरानी सीमाएँ $x$ गुना अधिक अनुमानित हैं। एक उदाहरण $\texttt{com-Youtube}$ डेटासेट में मित्र त्रिगुणों की गिनती कर रहा है, सबसे अच्छा निपुण बाउंड $1.2 \cdot 10^9$ है, सबसे अच्छा उभयलिंगी बाउंड $5.1 \cdot 10^8$ है, और वास्तविक कार्डिनैलिटी $1.8 \cdot 10^7$ है।

Share This

COMMENTS

Wordpress (0)
Disqus ( )