تاریخچه
داستان شکل گیری ایده ی طراحی R، در سال 1990 با ملاقات اتفاقی Ross Ihaka (که به تازگی به گروه آمار دانشگاه اوکلند پیوسته بود) و Robert Gentleman (که در حال گذراندن تعطیلاتش از دانشگاه واترلو بود) کلید خورد. حاصل این دیدار، جرقه خوردن نوشتن یک نرم افزار با هدف ایجاد یک بستر آزمایشی برای تست ایده ها، و انتشار یک یا دو مقاله بود! درسال 1992، تصمیم گرفته شد که از زبان برنامه نویسی S برای نوشتن R استفاده شود و به طنز، به خاطر Robert و Ross، نام “R” برای این زبان درنظر گرفته شد. در سال 1994، ورژن اولیه ی R کامل شد اما همچنان تا دو سال بعد، Robert و Ross کلی گزارش از باگ های R و بسیاری هم پیشنهاد برای بهبود این زبان دریافت می کردند. در نهایت در سال 1997، با افزایش تعداد کاربران R، بانیان اصلی این زبان، به موفقیت پیش بینی شده ی خود رسیدند!
مزیت های R
R ابزاری با هدف تجزیه و تحلیل داده ها می باشد که جهت آنالیز آماری، تجسم داده های بیولوژیکی و ایجاد مدل های داده استفاده می شود. از جمله ویژگی های بارز این ابزار، میتوان به موارد زیر اشاره کرد:
R متن باز (open source) است.
به این معنی که به صورت رایگان در اختیار کابران قرار میگیرد و همچنین کاربر میتواند از کد منبع استفاده کرده و آن را تغییر دهد. به علاوه، R به شکلی فعال توسط یک مجموعه در حال توسعه است ( r-project.org را ببینید)، و به روز رسانی های منظمی برایش وجود دارد.
R قدرتمند است.
- R بر روی چندین پلتفرم
قابل اجرا است (Windows/MacOS/Linux). R می تواند با دیتاست های بسیار بزرگتر از
برنامه های spreadsheet محبوب مانند Microsoft
Excel کار کند و به دلیل
قابلیت های اسکریپت نویسی آن بسیار قابل بازیابی (reproducible) است. - با R
طیف وسیعی از تکنیکهای آماری (مدلسازی خطی و غیرخطی،
آزمونهای آماری کلاسیک، تجزیه و تحلیل سریهای زمانی، طبقهبندی، خوشهبندی،
…) و گرافیکی، قابل اجرا خواهند بود.
“تصویر برخی از نمودارهای رسم شده با R را در ادامه می بینیم.” - R بر روی انواع مختلف دیتا (vector، array، matrix و …) با سایزهای مختلف، عملیات انجام میدهد.
- هزاران بسته (package) نرم افزاری در حیطه ی علوم، از جمله ژنومیک و سایر حوزه های علوم
زیستی برای R
وجود دارد.
CRAN
(https://cran.r-project.org) منبع (repository) اصلی برای پکیج های R است و نسخه های یکسان و
به روز از کد و اسناد را برای R ذخیره می کند.
Bioconductor
(https://www.bioconductor.org) پروژه ای است که دارای کدهای بر مبنای R برای آنالیز داده های
ژنومیک می باشد.
- R میتواند با استفاده از
پکیج هایی همچون ddR یا multiDplyr، محاسبات موازی یا توزیع
شده را پردازش کند.- R به کامپایلر (برنامهای
که کد نوشته شده از زبان مبدا را به زبان مقصد ترجمه میکند) نیاز ندارد. R یک زبان تفسیر شده است و
کد ارائه شده را به کدهای از پیش کامپایل شده تفسیر می کند.
- R به کامپایلر (برنامهای
- R با زبان های دیگر مانند C، C++، و FORTRAN سازگار است و با زبان هایی مانند دات نت، جاوا، و پایتون نیز می توان مستقیماً کدها را دستکاری کرد.
- R میتواند برای یادگیری ماشین نیز مفید باشد. فیسبوک بسیاری از تحقیقات یادگیری ماشین خود را با R انجام میدهد.
- R شامل چندین پکیج است که آن را قادر می سازد با پایگاه های داده تعامل داشته باشد، مانند: Roracle، ، RmySQL و … .
R ابزاری با کاربرد گستره است.
از آنجا که R نه تنها در زمینه ی بیوانفورماتیک، بلکه در بسیاری از رشته ها استفاده میشود، پس به احتمال زیاد، تقریباً هر پیام خطایی که با آن مواجه می شوید، شخص دیگری قبلاً آن را تجربه کرده است. بنابراین میتوانید روی کمک های آنلاین حساب کنید!
پیشنهاد: برای آشنایی با اهداف طراحی دارو در روشنسازی پوست، مقاله طراحی دارو در روشن سازی پوست را مطالعه کنید.
معایب R
- مدیریت حافظه R ضعیف است.
- دستورات R به مدیریت حافظه مربوط نمی شوند. در نتیجه R می تواند تمام فضای موجود را اشغال کند.
- سرعت R آهسته است.
- برنامه ها و توابع در R در پکیج های مختلف پخش شده اند. این باعث می شود که سرعت R نسبت به زبان هایی مانندMATLAB و Python کندتر باشد.
- امنیت R ضعیف است.
- R فاقد
اقدامات اولیه امنیتی است. بنابراین ساختن برنامه های وب با آن
همیشه ایمن نیست.
- R فاقد
- الگوریتم های R در پکیج های مختلف پراکنده هستند.
- برنامه نویسان بدون دانش قبلی از پکیج ها ممکن است برای پیاده سازی
الگوریتم ها دچار مشکل شوند.
- برنامه نویسان بدون دانش قبلی از پکیج ها ممکن است برای پیاده سازی
RStudio
RStudio یک محیط توسعه یکپارچه (IDE) برای R است که شامل کنسول، ویرایشگر هایلایت کننده ی سینتکس که اجرای مستقیم
کد را پشتیبانی میکند، و همچنین ابزارهایی برای ترسیم (plotting)، تاریخچه (history)، اشکال زدایی (debugging) و مدیریت فضای کاری می
باشد.
پیشنهاد: بهمنظور ثبت سفارش برای خدمات آنالیزهای آماری به صفحه خدمات آنالیزهای آماری مراجعه فرمایید. آنالیزهای آماری در میزکار وانیار و زیرنظر کارشناسان بیوانفورماتیک صورت میگیرد.
RStudio در نسخه های منبع باز و
تجاری موجود است و روی دسکتاپ (Windows/MacOS/Linux) و یا در مرورگر متصل به server
RStudio
یا RStudio Workbench
(Debian/Ubuntu,
Red Hat/CentOS, and SUSE Linux)، قابل اجرا می باشد.
درRStudio این امکان وجود دارد که بدون استفاده از دستور
خاصی، نمودارهای رسم شده را به صورت فایل pdf یا عکس ذخیره نمود. امکان نصب و
یا به روز رسانی کتابخانه های کاربردی مختلف نیز در قسمت Package فراهم شده است.
به منظور چشیدن شیرینی زبان R، به کار بردن RStudio توصیه میشود! ????
منابع:
https://www.r-project.org/about.html