4 اردیبهشت 1396
آکادمی اندیش سیستم: دبیرخانه دائمی کنفرانس هوش تجاری ایران و برگزارکننده MBA و DBA با گرایش هوش تجاری BI

درباره گارتنر

گروه گارتنر (Gartner)، یک مؤسسه تحقیقاتی در حوزه فناوری اطلاعات است که در سال 1979 توسط گیدون گارتنر در شهر استامفورد ایالات متحده تأسیس گردید. این کمپانی از سال 2002 به گارتنر موسوم گردید و تحقیقاتی که از همان ابتدا از سوی این گروه صورت گرفت بسیار مورد توجه مدیران ارشد اطلاعات و نیز رهبران ارشد فناوری اطلاعات در سازمان‌هایی از قبیل کارگزاری‌های دولتی، شرکت ‌های مخابراتی، مؤسسات خدماتی حرفه‌ای و سرمایه‌گذاران حوزه فناوری قرار گرفت.

کمپانی های بزرگ، کارگزاری‌های دولتی، شرکت‌های فناوری اطلاعات و جامعه سرمایه‌گذاران در حوزه فناوری اطلاعات از جمله مشتریان عمده گارتنر محسوب می‌شوند، بطوریکه گارتنر شریکی باارزش برای مشتریان 12,400 شرکت متفاوت قلمداد می‌گردد. حوزه فعالیت گارتنر به سه بخش اصلی تحقیق، برنامه‌های اجرایی و مشاوره تقسیم می‌گردد که توسط 5,300 عضو شامل 1,280 تحلیلگر، مشاور و مشتری در 85 کشور دنیا انجام می‌گیرد. گارتنر از طریق اطلاعاتی که از سه بخش فوق بدست می‌آورد، حوزه‌های فناوری هر کسب وکاری را تحلیل و تفسیر می‌کند. در سال 2011 این شرکت درآمدی بالغ بر 1.468 بیلیون دلار و نیز سود خالصی معادل 136.9 میلیون دلار کسب کرده است.

گارتنر هر ساله گزارشی از رتبه بندی شرکت های معتبر و جهانی که ارائه دهنده سیستم های هوش تجاری هستند، ارائه می کند تا متقاضیان این سیستم ها بتوانند براساس نیاز خود، بهترین انتخاب را داشته باشند.

جهت ملاحظه وب سایت گارتنر، کلیک کنید

جهت ملاحظه ارزیابی سال 2011 گارتنر از ارائه کنندگان سیستم هوش تجاری، کلیک کنید

 

 

در این صفحه از سایت آکادمی اندیش سیستم، پروژه های برتر آموزشی هوش تجاری BI که در قالب دوره های MBA و DBA با گرایش هوش تجاری BI، توسط دانشپذیران به اساتید آن دوره ها ارائه گردیده اند، نمایه شده اند. شایان ذکر است استفاده از محتوای پروژه های ذیل با ذکر منبع آنان (نام دانشپذیر و سایت آکادمی اندیش سیستم) بلامانع است. همچنین پروژه های ذیل پیوسته و به مرور زمان افزایش خواهند یافت.

 

موضوع پروژه: تفاوت سه مدل ستاره‌ای، دانه برفی و منظومه‌ای در طراحی انبار داده

دانشپذیر: جناب آقای فریدالدین پزشکان

نام درس: مدل­‌های طراحی انبار داده

چکیده: در فضای کسب و کار مدیران مختلف هر کدام با در نظر گرفتن فضای کاری و KPI‌های مد نظر خود یکی از ساختارهای ستاره‌ای، دانه برفی و منظومه ای را و یا ترکیبی از آنها را انتخاب می کنند.

جهت دانلود پروژه فوق، کلیک نمایید

 

موضوع پروژه: تفاوت رویکرد اینمون و کیمبال در مورد انبار داده

دانشپذیر: فرهاد تبریزی

نام درس: رویکردهای طراحی انبار داده

چکیده: در خصوص تفاوت رویکرد کیمبال و اینمون می توان بیان داشت که کیمبال (۱۹۹۷) معتقد است، انبار داده چیزی جز پیوستن تمام مراکز داده به هم نیست. روش کیمبال به صورت پایین به بالا است که هر مرکز داده که طیف نه چندان بزرگی از دیدگاه سازمان را تشکیل می‌دهد به عنوان داده سازمانی می تواند به وجود آید و بعدا با هم آمیخته شوند تا انبار داده کلی سازمان را بسازند. اینمون در سال ۱۹۹۸ در پاسخ به این دیدگاه گفت: می‌توان تمام ماهی‌های کوچک اقیانوس را گرفت و روی هم انباشت ولی این کار یک نهنگ به وجود نمی آورد. این دیدگاه که مخالف نظر کیمبال است، اعتقاد به تشکیل انبار داده از بالا به پایین دارد تا تمام داده‌های سازمان را در بر بگیرد.

جهت دانلود پروژه فوق، کلیک نمایید

 

موضوع پروژه: ارتباط تکنولوژی Hadoop با کلان داده

دانشپذیر: محمد محسن خدایی میدانشاه

نام درس: مفاهیم کلان داده (Big Data)

چکیده: حجم اطلاعات تولید شده توسط بشر تا سال ۲۰۱۳ برابر با همین حجم از اطلاعات تولید شده در ده دقیقه در سال ۲۰۱۳ است. این مثال برای سه سال پیش است و تصور کنید سال ۲۰۲۰ چه اتفاقی در اثر حجم اطلاعات تولید شده توسط پلتفرم‌ها، ماهواره‌ها، شبکه‌های اجتماعی و غیره خواهد افتاد. برای ذخیره‌سازی و پردازش این حجم از اطلاعات یا به اصطلاح کلان داده باید چاره‌ای اندیشید. شرکت‌هایی مثل گوگل، IBM، اوراکل و یاهو چگونه و با چه ابزاری چندین زتابایت داده را پردازش کنند. اصلاً آن‌ها را کجا و به چه صورتی ذخیره کنند تا به فکر پردازش آن‌ها بیفتند. تکنولوژی Hadoop برای پاسخگویی به این امر به وجود آمد. Hadoop یک پروژه مبتنی بر برنامه‌نویسی متن باز است که توسط سازمان نرم‌افزاری آپاچی ایجاد شده است.

جهت دانلود پروژه فوق، کلیک نمایید

 

موضوع پروژه: تفاوت سه مدل ستاره ای، دانه برفی و منظومه ای در طراحی انبار داده

دانشپذیر: محمد محسن خدایی میدانشاه

نام درس: مدل­‌های طراحی انبار داده

چکیده: مدل‌های ستاره‌ای (Star)، دانه برفی (Snowflake) و منظومه‌ای (Constellation) به منظور ساخت انبار داده مورد استفاده قرار می‌گیرند که نقطه مشترک همه آن‌ها دو نوع جدول Fact (حقایق) و Dimension (ابعاد) است.

جهت دانلود پروژه فوق، کلیک نمایید

 

موضوع پروژه: معرفی چهار مولفه اصلی کلان داده

دانشپذیر: وحید محمدی

نام درس: مفاهیم کلان داده (Big Data)

چکیده: امروزه به علت حجم بسیار بالای داده‌ها و محتواهای تولید شده توسط انواع و اقسام سازمانها، اشخاص و تجهیزات با پدیده “انفجار داده”مواجه شده‌ایم. گسترش فناوری‌های ارتباطی همچون فناوری‌های اینترنتی و اطلاعاتی (همچون انواع سرویس‌های الکترونیکی) جهان را با پدیده “سیل داده” مواجه کرده است. صنعت بیگ دیتا (Big Data) نشات گرفته از این پدیده‌های نوظهور است. داده‌های بزرگ (Big Data) مجموعه‌ای از تکنیک‌ها و تاکتیک‌هایی است که نیازمند شکل جدیدی از یکپارچگی هستند تا بتوانند ارزش‌های بزرگی را که در مجموعه‌های بزرگ، وسیع، پیچیده و متنوع داده پنهان شده‌اند، آشکار سازند.

جهت دانلود پروژه فوق، کلیک نمایید

 

موضوع پروژه: ارتباط تکنولوژی Hadoop با کلان داده

دانشپذیر: فهیمه طباطبایی

نام درس: مفاهیم کلان داده (Big Data)

چکیده: یک چارچوب متن باز برای ذخیره‌سازی و پردازش داده‌های بزرگ است که در ابتدا Doug Cutting در شرکت Apache آن را ارائه داد. هدف اصلی آنها از تولید این ابزار استفاده از آن در موتور جستجوی Apache به نام Nutch بود که پس از آن بسیاری از شرکت­های بزرگ مانند Facebook، Google، Yahoo و غیره از آن استفاده کردند. تکنولوژی Hadoop با ترکیب و توزیع داده به ذخیره سازی آن می‌پردازد و به زبان جاوا پیاده سازی شده است.

جهت دانلود پروژه فوق، کلیک نمایید

 

موضوع پروژه: تفاوت سه مدل ستاره ای، دانه برفی و منظومه ای در طراحی انبار داده

دانشپذیر: فهیمه طباطبایی

نام درس: مدل­‌های طراحی انبار داده

چکیده: تفاوت دو شمای ستاره‌ای و دانه برفی در این است که جداول شماهای دانه برفی نرمال هستند و افزونگی در آنها کاهش یافته است که این برای کار کردن با داده‌ها و از لحاظ فضای ذخیره سازی مفید است. ولی در عوض کارایی را پایین می آورد، زیرا در محاسبه Queryها به Joinهای بیشتری نیاز داریم. شمای ستاره‌ای این امکان را به کاربر می دهد که جداول بعد را بین جداول حقایق مختلف به اشتراک گذرند. در بسیاری از موارد شمای ستاره‌ای و شمای دانه برفی برای Data Mart مورد استفاده قرار می‌گیرند ولی Fact Constellations برای کل یک انبار داده به کار می آید.

جهت دانلود پروژه فوق، کلیک نمایید

 

موضوع پروژه: شاخص‌های کلیدی عملکرد KPIs

دانشپذیر: محمدعلی اوستام

نام درس: سیستم‌های اطلاعات سازمان

چکیده: تعریف و استفاده از شاخص‌های کلیدی عملکرد KPIs در هر سازمان اصلی‌ترین سنجه برای آگاهی از میزان رشد سازمان و رسیدن به اهداف استراتژیک است. تعریف این شاخص‌ها مقدمات و نیازهای خاصی دارد که مهمترین آن سرلوحه قرار دادن اهداف استراتژیک سازمان است. شاخص‌های کلیدی عملکرد باید در راستای دستیابی به این اهداف با قابلیت سنجش و اندازه‌گیری‌های دقیق در جهت ایجاد آگاهی و توان تصمیم گیری درست و هدایت مفید و موثر سازمان باشند.

جهت دانلود پروژه فوق، کلیک نمایید

 

موضوع پروژه: تفاوت داده کاوی و تحلیل آماری

دانشپذیر: فریدالدین پزشکان

نام درس: مفاهیم و تکنیک های داده کاوی

چکیده: داده کاوی فرآیند استخراج اطلاعات معتبر، از پیش ناشناخته، قابل فهم و قابل اعتماد از پایگاه داده‌های بزرگ و استفاده از آن در تصمیم‌گیری در فعالیت‌های تجاری می‌باشد که حاصل پیوند دو علم آمار و کامپیوتر است. پس می‌توان گفت که علم آمار یکی از ابزارهای مورد استفاده در داده کاوی است.

جهت دانلود پروژه فوق، کلیک نمایید

 

موضوع پروژه: تفاوت داده کاوی و تحلیل آماری

دانشپذیر: محمد محسن خدایی میدانشاه

نام درس: مفاهیم و تکنیک های داده کاوی

چکیده: علم داده کاوی از علوم مختلفی از جمله علم آمار، هوش مصنوعی، یادگیری ماشین، شناسایی الگو و پایگاه داده نشأت گرفته شده است. بنابراین پیش از این‌ که تفاوتی بین این دو علم وجود داشته باشد، علم آمار پایه و اساس داده کاوی را تشکیل می‌دهد. جالب‌ترین تفاوت داده کاوی با تحلیل‌های آماری این است که در آمار ما فرضیه‌ای طرح می‌کنیم و با استفاده از تحلیل‌های آماری به اثبات یا رد فرضیه می‌پردازیم اما داده کاوی به فرضیه احتیاجی ندارد.

جهت دانلود پروژه فوق، کلیک نمایید

 

موضوع پروژه: مزایا و معایب به کارگیری درخت تصمیم در طبقه بندی داده‌ها به همراه قابلیت ها و محدودیت های الگوریتم ID3

دانشپذیر: محمد محسن خدایی میدانشاه

نام درس: تکنیک طبقه بندی در داده کاوی

چکیده: روش‌های درخت تصمیم به ویژه در آشکار کردن تراکنش‌های پیچیده بین متغیرها، بسیار توانمند هستند. هر شاخه‌ای از درخت می‌تواند شامل ترکیبات مختلفی از متغیرها باشد و متغیرهای یکسان می‌توانند بیش از یک بار در قسمت‌های مختلف درخت ظاهر شوند. این امر می‌تواند مشخص کند که چگونه یک متغیر می‌تواند وابسته به متغیری دیگر باشد. الگوریتم ID3 بر مبنای نظریه اکمز ریزور است و اصولاً ترجیح می‌دهد که درخت‌های تصمیم کوچکتری داشته باشیم، اگرچه اغلب درخت‌ها کوچک نیستند.

جهت دانلود پروژه فوق، کلیک نمایید

 

موضوع پروژه: تفاوت داده کاوی و تحلیل آماری

دانشپذیر: وحید محمدی

نام درس: مفاهیم و تکنیک های داده کاوی

چکیده: تفاوت اصلی داده کاوی و علم آمار، در حجم داده های مورد تحلیل، روش مدل‌سازی داده ها و استفاده از هوش مصنوعی است. داده کاوی شباهت زیادی به تحلیل های آماری دارد. ولی داده کاوی از جهات زیادی با آمار متفاوت است و مزیت های زیادی نسبت به آمار دارد.

جهت دانلود پروژه فوق، کلیک نمایید

 

موضوع پروژه: مزایا و معایب بکارگیری درخت تصمیم در طبقه بندی داده ها به همراه قابلیت ها و محدودیت های الگوریتم ID3

دانشپذیر: وحید محمدی

نام درس: تکنیک طبقه بندی در داده کاوی

چکیده: روش تقسیم بندی داده‌ها با استفاده از درخت تصمیم از روش‌های شناخته شده در طبقه بندی داده‌ها می باشد که نیازی به تنظیم پارامترها از قبل و همچنین دانش اولیه از داده‌ها نمی‌باشد. این روش، جزء روش‌های طبقه بندی با ناظر قرار گرفته و با استفاده از داده‌های آموزشی که در اختیار آن قرار می‌گیرد می‌تواند درختی به نام درخت تصمیم که بر اساس ویژگی‌های هر کدام از داده‌ها در قسمت تست، آنها را برچسب گذاری می‌کند و نوع آنها را تشخیص دهد و با استفاده از این درخت می توان قوانینی برای سیستم استنتاج طراحی کرد و با استفاده از آن داده‌های بدون برچسب را برچسب گذاری نمود. الگوریتم ID3 توسط کوئینلن در سال ۱۹۸۶ معرفی گردید. این الگوریتم برای معرفی و ساخت درخت رده‌بندی با تقسیمات چندتایی در هر گره بسیار مناسب است و این الگوریتم برای متغیرهای کیفی طراحی گردید، ولی می‌توان از آن برای مجموعه‌ای از متغیرها، چه کیفی و چه عددی استفاده کرد.

جهت دانلود پروژه فوق، کلیک نمایید

 

موضوع پروژه: ارتباط تکنولوژی Hadoop با کلان داده

دانشپذیر: قاسم ناظری کناری

نام درس: مفاهیم کلان داده (Big Data)

چکیده: اگر بخواهیم تعریفی از کلان داده (Big Data) ارائه کنیم، می‌توانیم آن را “مجموعه داده‌هایی بدانیم که اندازه آنها فراتر از حدی است که با نرم افزارها و روش‌های معمول بتوان آنها را در یک زمان قابل قبول، دریافت، ذخیره، مدیریت و پردازش کرد.” بطور کلی بین داده‌های سنتی و داده‌های کلان از نظر اندازه، معماری، ساختار، مدل داده‌ای و ارتباط داخلی تفاوت‌هایی وجود دارد که با توجه به تعریف ارایه شده مهم‌ترین این تفاوت‌ها همان اندازه می‌باشد.

جهت دانلود پروژه فوق، کلیک نمایید

 

موضوع پروژه: تفاوت داده کاوی و تحلیل آماری

دانشپذیر: قاسم ناظری کناری

نام درس: مفاهیم و تکنیک های داده کاوی

چکیده: داده کاوی شاخه‌ی توسعه یافته و پیچیده ی علم آمار است. علم آمار به تنهایی برای صاحبان صنایع و شرکت ها بسیار اهمیت دارد. اما اهمیت داده کاوی فراتر از علم آمار می رود و امکاناتی در اختیار شما قرار می‌دهد که ساز و کارهایی آماری از انجام آنها ناتوان هستند. تفاوت اصلی علم آمار با شاخه‌ی توسعه یافته‌ی خود یعنی داده کاوی، در حجم داده‌های مورد تحلیل و روش مدل‌سازی داده‌هاست.

جهت دانلود پروژه فوق، کلیک نمایید

 

موضوع پروژه: تفاوت داده کاوی و تحلیل آماری

دانشپذیر: فهیمه طباطبایی

نام درس: مفاهیم و تکنیک های داده کاوی

چکیده: داده کاوی شباهت زیادی به تحلیل‌های آماری دارد و در عین حال از جهات زیادی با تحلیل‌های آماری در ماهیت متفاوت است. در واقع داده کاوی در بردارنده تحلیل آماری است و از تحلیل‌های آماری در ارائه تحلیل بهره می‌جوید. البته ناگفته نماند برخی از صاحب‌ نظران یادگیری ماشین (Machin Learning) و هوش مصنوعی (AI) را از داده کاوی جدا نموده و برخی آنها را در مجموعه تکنیک های داده کاوی قرار می‌دهند.

جهت دانلود پروژه فوق، کلیک نمایید

 

موضوع پروژه: ارتباط تکنولوژی Hadoop و کلان داده

دانشپذیر: پیمان احمدی

نام درس: مفاهیم کلان داده (Big Data)

چکیده: آپاچی هدوپ™ از نیاز به پردازش نزول ناگهانی کلان داده متولد شد. وب اطلاعات بیشتر و بیشتری را به صورت روزانه تولید می‌کرد، و نمایه سازی بیش از یک میلیارد صفحه‌ی محتوا بسیار دشوارتر می‌شد. به منظور مقابله با این مسئله، گوگل یک سبک جدید از پردازش داده‌های شناخته شده به عنوان نگاشت-کاهش را اختراع کرد. در حال حاضر هدوپ به طور گستردهای در صنایع، از جمله امور مالی، رسانه‌ها و سرگرمی، دولت، بهداشت و درمان، خدمات اطلاعات، خرده فروشی، و صنایع دیگر با شرایط کلان داده استفاده می‌شود اما محدودیت‌های زیر ساخت ذخیره‌سازی اصلی باقی می‌ماند.

جهت دانلود پروژه فوق، کلیک نمایید

 

موضوع پروژه: تفاوت تحلیل آماری و داده کاوی

دانشپذیر: ریحانه زهرا اسفندیارپور

نام درس: مفاهیم و تکنیک های داده کاوی

چکیده: قابلیت تعمیم نتایج عمومی  یکی از مشخصه‌های متمایز کننده داده کاوی و تحلیل آماری است. از آنجائی که روش‌های مرسوم تحلیل آماری در رابطه با تحلیل داده‌های اولیه‌ای است که در ارتباط با فرضیه تحقیقاتی ویژه‌ای جمع‌آوری شده‌اند؛ داده کاوی می‌تواند در ارتباط با داده‌های ثانویه‌ای که به دلایل مختلف جمع‌آوری شده است، باشد. از این گذشته داده‌های آماری می‌توانند داده‌های حاصل از آزمایش‌های مختلف باشد (مانند نتایج یک آزمایش که به طور تصادفی در رفتارهای مختلف به همه واحدهای آماری تخصیص داده می‌شوند)، اما در داده کاوی داده‌ها بیشتر مشاهده‌ای می‌باشد.

جهت دانلود پروژه فوق، کلیک نمایید

 

موضوع پروژه: تفاوت رویکرد اینمون و کیمبال در مورد انبار داده

دانشپذیر: ریحانه زهرا اسفندیارپور

نام درس: رویکردهای طراحی انبار داده

چکیده: در رویکرد اینمون انباره داده با استفاده از نرمال سازی دیتا مدل طراحی می‌شود. اتمیک داده‌ها در پایین ترین سطح جزئیات قرار دارند. در حالی که در رویکرد کیمبال ابتدا دیتا مارت‌ها برای تولید گزارشات و تحلیل توانایی‌ها برای پردازش‌های خاص ایجاد می‌شوند. نکته مهم درباره این مدل که پایین به بالاست توانایی مدل کردن فعالیت‌های از بالا به پایین می‌باشد. دیتا مارت‌ها شامل حقایق، نکات کلیدی می‌باشند.

جهت دانلود پروژه فوق، کلیک نمایید

 

موضوع پروژه: اوجگیری خطوط هوایی کانتیننتال (Continental) به وسیله انبارداده

دانشپذیر: فهیمه طباطبایی

نام درس: هوش تجاری از دیدگاه مدیریتی

چکیده: اگر از رویکرد سیستمی (System Thinking) به یک شرکت هواپیمایی بنگریم، در بیرون مرز زیرسیستم (شرکت هواپیمایی) عامل‌های متعددی می بینیم که بر عملکرد شرکت تاثیر گذار است و می‌تواند موجب تغییر در استراتژی کلان و خرد شرکت باشد. بزرگترین عامل مشتری و نیازهای وی از شرکت است. شرکت‌های رقیب نیز عامل مهم دیگر محسوب می‌شود. سیاست‌های کلان و خرد و عوامل تکنیکال که موجب تغییرات سریع در شرایط شرکت هواپیمایی است از دیگر عوامل مورد تحلیل است.

جهت دانلود پروژه فوق، کلیک نمایید

 

موضوع پروژه: مزایا و معایب بکارگیری درخت تصمیم در طبقه بندی داده ها به همراه قابلیت ها و محدودیت های الگوریتم ID3

دانشپذیر: فهیمه طباطبایی

نام درس: تکنیک طبقه بندی در داده کاوی

چکیده: مزایا و معایب بکارگیری درخت تصمیم در طبقه بندی داده ها به همراه قابلیت ها و محدودیت های الگوریتم ID3 در قالب جدول بطور جامع بیان شده است.

جهت دانلود پروژه فوق، کلیک نمایید

 

موضوع پروژه: معرفی چهار مولفه اصلی کلان داده

دانشپذیر: مریم صالحی مقدم

نام درس: مفاهیم کلان داده (Big Data)

چکیده: با ورود به عصر اطلاعات و ارتباطات و آغاز استفاده از داده‌ها و اطلاعات به عنوان سرمایه‌های اصلی در حرکت علمی، اقتصادی، اجتماعی و فرهنگی جوامع، سازمان‌ها و شرکت‌های مختلف، توسعه مشارکت افراد در جهان اینترنت و ارتباطات شبکه‌ای در دنیا، دغدغه‌ای بروز پیدا کرد که از جنس همین داده‌هایی بود که همه روزه و با سرعت وحشتناک در دنیا و در عرصه‌های مختلفی که فناوری اطلاعات ورود پیدا کرده بود، تولید می شود و آن اینکه چگونه این حجم بزرگ و متنوع داده‌ها و اطلاعات را با توجه به ساختار‌هایی که در فضای فناوری اطلاعات وجود دارد، می‌‌توان مدیریت، کنترل و پردازش کرد و از آن در جهت بهبود ساختارها و سودآوری بیشتر بهره جست.

جهت دانلود پروژه فوق، کلیک نمایید

 

موضوع پروژه: واکنش الگوریتم K-Means نسبت به داده های پرت و راهکارهای آن

دانشپذیر: نجمه رضوی

نام درس: تکنیک خوشه بندی در داده کاوی

چکیده: الگوریتم K-Means زمانی که داده Well separated و به خوبی تفکیک پذیر هستند بهترین نتیجه را می‌دهد و یکی از ساده ترین و سریع ترین و معروف ترین الگوریتم های Partitional است و از روش یادگیری Unsupervised برای انجام خوشه بندی استفاده می کند و با دیتاست‌های بزرگ هم به خوبی کار می‌کند یعنی اگر داده‌های زیادی داشتیم بهتر است از روش‌های سلسله مراتبی استفاده نکنیم. با این وجود یکسری معایب دارد. مثلا به شدت نسبت به Outlier یا داده‌های پرت و نویز حساس است و در ضمن از قبل باید تعداد کلاسترها را تعیین کرد.

جهت دانلود پروژه فوق، کلیک نمایید

 

موضوع پروژه: ارتباط تکنولوژی Hadoop با کلان داده

دانشپذیر: بصیره مرادی

نام درس: مفاهیم کلان داده (Big Data)

چکیده: Hadoop یک نرم افزار کد باز (Open source) است که برای تقسیم بندی و توزیع فایل‌های متمرکز به کار می‌رود. Hadoop تحت لیسانس آپاچی (Apache) ارائه می‌شود و توسط جاوا برنامه نویسی شده است. اما Hadoop چگونه به وجود آمد؟ شرکت گوگل در پی افزایش حجم تبادل اطلاعات، به دنبال راه حلی برای افزایش سرعت و راندمان سرورهای خود بود که سیستم توزیع (Distribution) منحصر به فردی برای خود ابداع کرد به نام GFS که مخفف Google File System بود. در پی این موفقیت، انجمن توزیع Apache به فکر گسترش این تکنولوژی در سطح وسیع تری افتاد و سیستم هدوپ به وجود آمد.

جهت دانلود پروژه فوق، کلیک نمایید

 

موضوع پروژه: مزایا و معایب به کارگیری درخت تصمیم در طبقه بندی داده‌ها به همراه قابلیت ها و محدودیت های الگوریتم ID3

دانشپذیر: بصیره مرادی

نام درس: تکنیک طبقه بندی در داده کاوی

چکیده: از مزایای درخت تصمیم می‌توان به: ۱- قوانین تولید شده و به کارگرفته شده قابل استخراج و قابل فهم می باشند و ۲- درخت تصمیم، توانایی کار با داده های پیوسته و گسسته را دارد (روش های دیگر فقط توان کار با یک نوع را دارند. مثلاً شبکه‌های عصبی فقط توان کار با داده‌های پیوسته و قوانین انجمنی در رابطه با دادههای گسسته را دارند) و … و از معایب آن می‌توان به ۱- در مواردی که هدف از یادگیری، تخمین تابعی با مقادیر پیوسته است مناسب نیستند و ۲- در موارد با تعداد دسته‌های زیاد و نمونه آموزشی کم، احتمال خطا بالاست اشاره کرد. فضای فرضیه ID3، یک فضای کامل از توابع مقدار گسسته متناهی، مربوط به صفات موجود است. چون هر تابع مقدار گسسته، می‌تواند با نوعی از درخت تصمیم نشان داده شود؛ این الگوریتم مانع از خطرات روش‌هایی که فضاهای فرضیه ناقص را جستجو می‌کنند، می‌شود (مانند روش‌هایی که فقط فرضیات فصلی را در نظر می‌گیرند) که در آنها، فضای فرضیه ممکن است حاوی تابع هدف نباشد.

جهت دانلود پروژه فوق، کلیک نمایید