چکیده
در این فصل ما به معرفی موضوعات مرتبط به آمار توصیفی پرداخته و در انجام این کار روش هایی را برای توصیف و خلاصه کردن مجموعه داده ها یاد گرفته ایم. بخش 2.2 در ارتباط با روش های توصیف مجموعه داده ها می باشد. زیرشاخه های 2.2.1 و 2.2. 2 نشان می دهد که چگونه داده ها که بر مبنای مقادیر مجزا می باشند، با استفاده از جدول فراوانی و نمودار توصیف می گردند، درحالی که زیربخش های 2.2. 3 مرتبط به داده هایی می باشند که مجموعه مقادیر آن ها بر مبنای فواصل متفاوت گروه بندی می شود. بخش 2. 3 به بحث در مورد روش های خلاصه کردن مجموعه داده ها با استفاده از آمار می پردازد، که بر مبنای کمیت های عددی می باشند که ارزش آن ها بر مبنای داده ها تعیین می گردد. زیر شاخه 2. 3.1 سه آمار را مد نظر قرار می دهد که برای نشان دادن مرکز مجموعه داده ها مورد استفاده قرار می گیرد: که شامل میانگین نمونه، میانه نمونه، و مد نمونه می باشد. زیرشاخه 2. 3.2 به معرفی واریانس نمونه و ریشه دوم به نام انحراف معیار نمونه می پردازد. این آمار برای نشان دادن فاصله مقادیر در مجموعه داده مورد استفاده قرار می گیرد. زیر شاخه 2. 3. 3 در ارتباط با درصد نمونه ها بوده که بر مبنای آمارهایی می باشند که برای نمونه به ما می گوید، کدام مقدار داده بیش از 99 درصد از تمام داده ها می باشد. در بخش 2.4 نامعادله چبیشف را برای داده نمونه نشان می دهیم. این نامعادله، کران پایین نسبت داده را نشان می دهد که متفاوت از میانگین نمونه با بیش از 10 برابر انحراف معیار نمونه می باشد. در حالی که نابرابری چبیشف در ارتباط با تمام مجموعه داده مد نظر قرار می گیرد، ما می توانیم در شرایط خاص، که در بخش 2.5 به بحث در مورد آن پرداخته شده، برآورد دقیق تری از نسبت داده هایی که در انحراف معیار نمونه k از میانگین نمونه قرار دارد، بدست آوریم. در بخش 2.5 ما این مورد را مد نظر قرار می دهیم که زمانی که نموداری از داده ها اشکال زنگی شکل را دنبال می کند، گفته می شود که این مجموعه داده ها به صورت تقریبی نرمال بوده؛ و برآورد دقیق تری توسط قوانین تجربی داده می شود. بخش 2.6 مرتبط با شرایطی می باشد که داده ها شامل مقادیر مزدوج می باشند. تکنیک گرافیکی که به نام نمودار پراکنش می باشد، برای ارائه چنین داده هایی معرفی می شود، همان طور که ضریب همبستگی نمونه، به عنوان آماری می باشد که نشان دهنده مقادیری می باشد که مقادیر بزرگ اولین عضو از این زوج ها، سازگار با مقادیر بزرگ عضو دوم می باشد.