معرفی MAFFT و جایگاه آن در بیوانفورماتیک
همترازسازی چندگانه توالی (Multiple Sequence Alignment) یکی از بنیادیترین فرایندها در حوزه علوم زیستی و بیوانفورماتیک محسوب میشود. این فرایند به پژوهشگران این امکان را میدهد تا روابط تکاملی، شباهتها و تفاوتهای موجود بین مجموعهای از توالیهای DNA ، RNA یا پروتئین را به دقت مورد تحلیل قرار دهند. در میان ابزارهای متنوع موجود برای این منظور، MAFFT (Multiple Alignment using Fast Fourier Transform) به عنوان یکی از ابزارهای پیشرو و پرکاربرد شناخته میشود. این نرمافزار که با هدف ایجاد تعادلی بهینه میان سرعت پردازش و دقت در همترازسازی طراحی شده است، از الگوریتم تبدیل سریع فوریه (FFT) برای شناسایی سریع نواحی همولوگ در توالیها بهره میبرد. این رویکرد، MAFFT را قادر میسازد تا حجم انبوهی از دیتای توالییابی را در زمان کوتاهی پردازش کند و به نتایج قابل اعتمادی دست یابد.
تاریخچه توسعه MAFFT
نرمافزار MAFFT برای اولین بار در سال ۲۰۰۲ توسط Kazutaka Katoh و همکارانش معرفی شد. هدف از توسعه این ابزار، ارائه راهکاری با کارایی بالا بود که بتواند علاوه بر دقت، سرعت محاسبات را نیز در مدیریت دادههای حجیم بهبود بخشد. تیم توسعهدهنده با بهکارگیری نوآورانه الگوریتم تبدیل سریع فوریه (FFT)، توانست سرعت همترازسازی را بهطور چشمگیری افزایش دهد.
مسیر تکامل MAFFT با ارائه استراتژیهای متنوع ادامه یافت؛ از روشهای سریع برای دادههای بسیار بزرگ گرفته تا روشهای دقیقتر و تکرارشونده (Iterative) مانند L-INS-i و G-INS-i که دقت همترازسازی را به سطوح بالایی رساندند. همچنین، قابلیتهای پیشرفتهای نظیر همترازسازی مبتنی بر ساختار برای RNA و پشتیبانی از پردازش موازی، این ابزار را از یک برنامه ساده به یک پلتفرم قدرتمند تبدیل کرده است.
در نسخه هفتم، این ابزار با بهبودهای قابلتوجهی در زمینه کاربردپذیری و عملکرد روبرو شده است؛ از جمله قابلیت اضافه کردن توالیهای جدید به الاینمنت موجود، مدیریت بهتر جهت توالیهای نوکلئوتیدی و بهینهسازی فرایندها برای استفاده در محاسبات موازی. امروزه MAFFT به عنوان یکی از استانداردهای طلایی در جامعه بیوانفورماتیک شناخته میشود و در طیف گستردهای از تحلیلهای فیلوژنتیک و شناسایی الگوهای بیولوژیکی نقش کلیدی ایفا میکند.
تبدیل سریع فوریه و کاربرد آن در MAFFT
قلب تپنده MAFFT، استفاده از تبدیل سریع فوریه (FFT) برای شناسایی سریع مناطق مشابه بین توالیهاست. این تکنیک ریاضی پیچیده، اجازه میدهد تا همبستگی بین دو توالی با سرعت بسیار بیشتری محاسبه شود. در روش سنتی، مقایسه مستقیم توالیها با پیچیدگی محاسباتی O(N²) انجام میشد، اما با استفاده از FFT، این پیچیدگی به O(N log N) کاهش مییابد. MAFFT ابتدا هر آمینواسید یا نوکلئوتید را به یک بردار عددی تبدیل میکند، سپس با استفاده از FFT، همبستگی متقابل این بردارها را محاسبه مینماید. این رویکرد به MAFFT اجازه میدهد تا مناطق مشابه را با سرعت بسیار بالایی شناسایی کند، که در مقایسه با روشهای مبتنی بر برنامهنویسی پویا (Dynamic Programming)، مزیت قابل توجهی محسوب میشود.
استراتژیهای مختلف MAFFT و کاربردهای آنها
MAFFT مجموعهای جامع از استراتژیهای الاینمنت را ارائه میدهد که هر کدام برای شرایط خاصی بهینه شدهاند. این تنوع به کاربران اجازه میدهد تا بر اساس نوع توالیها و اهداف تحلیلی خود، مناسبترین روش را انتخاب کنند.

استراتژیهای MAFFT را میتوان به دو دسته اصلی تقسیم کرد:
- روشهای پیشرفته (Advanced Strategies): این روشها دقت بالاتری را ارائه میدهند اما معمولاً زمانبرتر هستند.
- G-INS-i: ایدهآل برای توالیهایی با شباهت سراسری (global similarity). این استراتژی از الگوریتم Needleman-Wunsch برای مقایسه تمامی جفت توالیها استفاده کرده و بالاترین دقت را تضمین میکند. برای توالیهای پروتئینی با ساختارهای حفاظتشده یا خانوادههای ژنی با روابط نزدیک، انتخاب اول است.
- L-INS-i: مناسب برای توالیهایی که دارای نواحی محلی مشابه (local similarity) هستند، اما این نواحی توسط بخشهای غیرمشابه از هم جدا شدهاند. این روش از الگوریتم Smith-Waterman برای شناسایی دقیق این نواحی بهره میبرد.
- E-INS-i: طراحی شده برای توالیهایی که دارای چندین دامنه (domain) مشابه هستند که ممکن است به صورت نامنظم قرار گرفته باشند.
- روشهای سریع (Fast Strategies): این روشها سرعت بیشتری دارند و برای مجموعه دادههای بزرگ مناسب هستند، اما ممکن است دقت کمتری نسبت به روشهای پیشرفته داشته باشند. تبدیل سریع فوریه (FFT) موتور محرک سرعت در این روشهاست.
- FFT-NS-1 و FFT-NS-2: این استراتژیها که جزو روشهای پیشرونده (progressive) محسوب میشوند، برای پردازش مجموعه دادههای حجیم بسیار کارآمد هستند و برای تحلیلهای اولیه یا زمانی که سرعت اولویت دارد، توصیه میشوند.
دانلود، نصب و راهاندازی MAFFT
نصب MAFFT روی اکثر سیستمعاملها نسبتاً ساده است و معمولاً تنها با چند دستور قابل انجام است. علاوه بر نسخه قابل نصب، MAFFT بهصورت یک سرور وب نیز در دسترس است که برای کاربرانی که نمیخواهند نرمافزار را نصب کنند یا فقط به انجام تحلیلهای محدود و موردی نیاز دارند، گزینهای سریع و مناسب به شمار میآید.
در ادامه، دستورالعملهای نصب و اجرای MAFFT در پلتفرمهای مختلف به همراه لینکهای مستقیم دانلود برای هر سیستمعامل ارائه شده است.
نصب و اجرای MAFFT در سیستمعامل macOS
ابتدا بسته نصبی زیر را که با نسخههای مک 10.12 تا 11.4 سازگار است، دانلود نمایید:
اکنون مراحل زیر را طی کنید:
- پنجره ترمینال را باز کنید (مسیر:
Finder → Applications → Utilities → Terminal). - فایل فشرده دانلودشده را در پوشه دلخواه خود استخراج کنید.
- با استفاده از دستور
cdبه مسیر فایل بروید:
cd /path/to/directory/
unzip mafft-7.490-mac.zip
- پس از استخراج، پوشهای با نام
mafft-macایجاد میشود که حاوی اسکریپتmafft.batو زیرپوشهmafftdirاست.
نرمافزار MAFFT در macOS از دو طریق قابل اجراست: «خط فرمان» برای بهرهگیری از تمامی قابلیتهای پیشرفته، و «حالت تعاملی» برای کاربران مبتدی …
۱. حالت خط فرمان (Command-line mode)
در این حالت، اسکریپت mafft.bat را با تعیین مسیر کامل فراخوانی کنید. توجه داشته باشید که در این روش، نامهای مستعار (مانند mafft-linsi) در دسترس نیستند و باید گزینهها به صورت کامل وارد شوند.
- مثال برای اجرای پایه:
/path/to/mafft-mac/mafft.bat input.txt > output.txt
- مثال برای جایگزینی دستور
mafft-linsi:
/path/to/mafft-mac/mafft.bat --localpair --maxiterate 100 input.txt > output.txt
۲. حالت تعاملی (Interactive mode)
این حالت تنها در صورتی پیشنهاد میشود که روش خط فرمان برای نیاز شما مناسب نباشد.
- فایل ورودی (Input) خود را در پوشه
mafft-macکپی کنید:
cp input.txt /path/to/mafft-mac/
- به پوشه مذکور وارد شوید:
cd /path/to/mafft-mac/
- اسکریپت را اجرا کرده و طبق دستورالعملهای ظاهر شده در ترمینال عمل کنید:
./mafft.bat
- پس از اجرای دستور، از شما خواسته میشود نام فایل ورودی را وارد کنید (به عنوان مثال:
@input.txt).
نصب و اجرای MAFFT بر روی ویندوز (از طریق WSL)
برای اجرای MAFFT در محیط ویندوز ۱۰ یا ۱۱، بهترین روش استفاده از WSL (Windows Subsystem for Linux) است. این ابزار به شما اجازه میدهد توزیع اوبونتو (Ubuntu) را مستقیماً در ویندوز اجرا کرده و نرمافزارهای لینوکسی را بدون نیاز به ماشین مجازی سنگین، استفاده کنید.
بخش اول: نصب Ubuntu روی ویندوز
- ترمینال ویندوز (
PowerShellیاcmd.exe) را به صورت Administrator باز کنید. - دستور زیر را وارد کنید تا اوبونتو نصب شود:
wsl --install
- پس از پایان نصب و در صورت نیاز، سیستم را ریاستارت کنید. برای ورود به محیط اوبونتو، کافیست دستور زیر را وارد کنید:
wsl
بخش دوم: نصب MAFFT در اوبونتو
پس از باز شدن محیط اوبونتو، مراحل زیر را برای نصب MAFFT دنبال کنید:
- دانلود بسته نصب:
- نصب بسته:
sudo dpkg -i mafft_7.526-1_amd64.deb
- تأیید نصب: برای اطمینان از نصب صحیح، مسیر و نسخه نرمافزار را چک کنید:
which mafft
mafft --version
بخش سوم: روشهای استفاده
نرمافزار MAFFT در محیط ویندوز از ۳ روش زیر قابل اجراست:
۱. حالت تعاملی (Interactive Mode):
فایلهای ویندوزی شما در اوبونتو از طریق مسیر /mnt/c/ در دسترس هستند. برای مثال، پوشه C:\Users\YourName\DATA در اوبونتو به صورت /mnt/c/Users/YourName/DATA نمایش داده میشود.
- ابتدا به پوشه مورد نظر بروید:
cd /mnt/c/Users/YourName/DATA
- با دستور
lsاز وجود فایل اطمینان حاصل کنید. - برای اجرای MAFFT در حالت تعاملی، صرفاً دستور
mafftرا تایپ کنید و طبق راهنمای گامبهگام نرمافزار، فایل ورودی و تنظیمات را انتخاب کنید.
۲. حالت خط فرمان (Command-line Mode):
برای استفاده حرفهای و سریع:
mafft --option input.txt > output.txt
۳. اجرای MAFFT از خارج محیط اوبونتو:
اگر قصد دارید از داخل محیط ویندوز (یا از طریق نرمافزارهای دیگر) MAFFT را فراخوانی کنید، از دستور wsl.exe استفاده کنید:
wsl.exe mafft --option --out output.txt input.txt
نکته: اگر از قابلیتهای پیشرفته مانند «درخت راهنمای سفارشی» (User-defined guide tree) استفاده میکنید، نیاز به نصب Ruby دارید:
apt install ruby
نصب و اجرای MAFFT بر روی ویندوز (بسته All-in-one)
ابتدا فایل فشرده نرمافزار را از لینک زیر دانلود کنید:
پس از دانلود فایل، آن را در یک پوشه مناسب استخراج کنید. بهتر است از پوشههای Desktop و Documents استفاده نکنید، زیرا ممکن است توسط Windows Defender محدود شوند.
روش نصب
- فایل ZIP را با گزینه Extract All از حالت فشرده خارج کنید.
- در هنگام استخراج، مطمئن شوید که فرمت پایان خط فایلهای متنی به CRLF تغییر نکند و LF حفظ شود.
روش استفاده
- یک فایل ورودی با فرمت FASTA را در پوشه
mafft-winقرار دهید. - برای اجرای برنامه میتوانید:
- روی
mafft.batدوبار کلیک کنید، یا - روی
mafft-signed.ps1راستکلیک کرده و گزینه Run with PowerShell را انتخاب کنید.
- روی
اجرای خط فرمان
MAFFT را میتوان از Command Prompt یا PowerShell نیز اجرا کرد. برای مثال:
mafft.bat --out output.txt --localpair input.txt
یا در PowerShell:
.\mafft-signed.ps1 --out output.txt --localpair input.txt
نکات مهم
- برای افزایش سرعت میتوان از گزینه
--threadبرای استفاده از چند هسته پردازشی استفاده کرد. - گزینههای پیشرفتهای مانند
--adjustdirectionو--memsavetreeنیز قابل استفاده هستند. - این نسخه از همترازی ساختار RNA مانند
X-INS-iوQ-INS-iپشتیبانی نمیکند. - برای انتقال برنامه، کافی است کل پوشه
mafft-winرا به محل جدید منتقل کنید.
اجرای الاینمنت توالیها با MAFFT
در ادامه به بررسی ساختار دستورات پایه MAFFT، پارامترهای کلیدی و مثالهای عملی برای همترازسازی توالیها میپردازیم تا بتوانید از این ابزار قدرتمند به بهترین نحو استفاده کنید.
ساختار دستورات اصلی
ساختار دستورات MAFFT ساده و منطقی است، که آن را برای کاربران مبتدی و پیشرفته قابل دسترس میسازد. فرمت پایه دستور MAFFT به صورت mafft [options] input > output است. بخش [options] شامل پارامترهای مختلفی است که نحوه عملکرد الگوریتم را کنترل میکنند.

برای مثال:
گزینه –auto به MAFFT اجازه میدهد تا بر اساس تعداد و طول توالیها، بهترین استراتژی را انتخاب کند.
گزینههای –localpair و –globalpair به ترتیب استراتژیهای L-INS-i و G-INS-i را فعال میکنند.
پارامتر –maxiterate تعداد تکرارهای بهینهسازی را مشخص میکند.
برای دادههای بزرگ، میتوان از گزینه –thread برای تعیین تعداد هستههای پردازشی استفاده کرد.
گزینههای دیگری نیز برای تنظیم معیارهای گپ، مدلهای جایگزینی و فرمت خروجی وجود دارد که درک صحیح این پارامترها برای دستیابی به نتایج بهینه بسیار مهم است.
یک مثال عملی از همترازسازی ساده
در ادامه، برای درک بهتر نحوه استفاده از MAFFT، یک مثال عملی ارائه میدهیم:
فرض کنید فایلی به نام merged_files.fasta داریم که حاوی چندین توالی نوکلئوتیدی است. برای انجام یک الاینمنت ساده با استفاده از تنظیمات خودکار، دستور زیر را اجرا میکنیم:
mafft --auto merged_files.fasta > aligned.fasta
این دستور به MAFFT میگوید که بهترین استراتژی را انتخاب کند و نتیجه را در فایل aligned.fasta ذخیره نماید.
برای مشاهده و بررسی نتایج MSA میتوانید فایل aligned.fasta را با ابزارهایی مانند UGENE بهصورت گرافیکی باز کنید:

* اگر بخواهیم از استراتژی دقیقتری مانند L-INS-i استفاده کنیم، میتوانیم از دستور زیر استفاده کنیم:
mafft --localpair --maxiterate 1000 sequences.fasta > aligned_accurate.fasta
در این دستور، پارامتر –maxiterate 1000 تعداد تکرارهای بهینهسازی را به 1000 افزایش میدهد که منجر به الاینمنت دقیقتری میشود.
* برای توالیهای بسیار زیاد، میتوان از روش سریعتری استفاده کرد:
mafft --retree 2 --maxiterate 0 sequences.fasta > aligned_fast.fasta
این مثالها نشان میدهند که چگونه میتوان با تنظیم پارامترهای مختلف، عملکرد MAFFT را برای نیازهای مختلف تحلیلی بهینه کرد.
همچنین، برای الاینمنت سریع چند توالی، میتوان از نسخه آنلاین MAFFT استفاده کرد. تصویر زیر، حاصل مشاهده نتایج الاینمنت با استفاده از نسخه آنلاین MAFFT و ابزار MSAviewer است.

کاربردهای MAFFT در تحقیقات بیوانفورماتیک
در این بخش، به بررسی کاربردهای کلیدی نرمافزار MAFFT در حوزههای مختلف تحقیقات بیوانفورماتیک میپردازیم. از تحلیلهای فیلوژنتیک و شناسایی موتیفها گرفته تا طراحی دارو و واکسن، MAFFT ابزاری قدرتمند برای درک روابط تکاملی و عملکردی مولکولهای زیستی است.
آنالیزهای فیلوژنتیکی
مطالعات فیلوژنتیک به بررسی روابط تکاملی بین ارگانیسمها یا ژنها میپردازند و الاینمنت دقیق توالیها پیشنیاز اساسی این تحلیلهاست.
همترازسازیهای MAFFT به دلیل دقت بالا و توانایی در حفظ ساختارهای مهم توالی، دادههای مناسبی برای بازسازی درختهای فیلوژنتیک فراهم میکنند. پس از همترازسازی با MAFFT، خروجی را میتوان مستقیماً در نرمافزارهای تحلیل فیلوژنتیک مانند RAxML ، MEGA ، MrBayes یا IQ-TREE وارد کرد. برای اطمینان از کیفیت تحلیل فیلوژنتیک، استفاده از استراتژیهای دقیق MAFFT مانند G-INS-i یا L-INS-i توصیه میشود. همچنین، قبل از استفاده از همترازسازی برای بازسازی درخت، پردازشهایی مانند حذف مناطق با همترازی ضعیف یا نواحی با گپ زیاد (با استفاده از ابزارهایی مانند Gblocks یا trimAl) میتواند به بهبود دقت تحلیل فیلوژنتیک کمک کند.
شناسایی موتیفها و نواحی حفاظتشده
یکی از کاربردهای مهم الاینمنت توالی، شناسایی موتیفها و نواحی حفاظتشده است که میتواند بینشهای ارزشمندی درباره عملکرد و اهمیت بخشهای مختلف توالی ارائه دهد.
همترازسازیهای باکیفیت MAFFT، بهویژه با استفاده از استراتژیهای دقیق مانند L-INS-i، امکان شناسایی مناطقی را فراهم میکنند که طی تکامل حفظ شدهاند. این نواحی حفاظتشده معمولاً نشاندهنده بخشهای عملکردی مهم مانند سایتهای کاتالیتیک آنزیمها، دامنههای اتصال به لیگاند یا مناطق تنظیمی هستند. پس از همترازسازی، میتوان از ابزارهای تکمیلی مانند WebLogo برای تصویرسازی و نمایش میزان حفاظت در هر موقعیت استفاده کرد. همچنین، نرمافزارهای تخصصی شناسایی موتیف مانند MEME یا GLAM2 میتوانند روی همترازسازیهای MAFFT اعمال شوند تا الگوهای تکراری یا موتیفهای با اهمیت بیولوژیکی را شناسایی کنند. این تحلیلها در طراحی پرایمر، مطالعات مهندسی پروتئین و درک مکانیسمهای مولکولی بسیار ارزشمند هستند.
کاربرد در مطالعات طراحی دارو و واکسن
در طراحی دارو، شناسایی نواحی حفاظتشده در پروتئینهای هدف میتواند سایتهای مناسب برای اتصال دارو را مشخص کند. بهعنوان مثال، الاینمنت چندگانه آنزیمهای ویروسی از سویههای مختلف میتواند نواحی حفاظتشدهای را مشخص کند که کمتر دچار جهش میشوند و بنابراین اهداف مناسبتری برای طراحی داروهای ضدویروسی هستند.
در زمینه طراحی واکسن، MAFFT برای همترازسازی آنتیژنها از سویههای مختلف پاتوژن استفاده میشود تا مناطق ایمونوژنیک مشترک شناسایی شوند. این رویکرد بهویژه برای پاتوژنهایی مانند آنفولانزا یا HIV که تنوع آنتیژنی بالایی دارند، ارزشمند است. همچنین، تحلیل تکاملی مبتنی بر همترازسازیهای MAFFT میتواند در پیشبینی جهشهای احتمالی آینده و طراحی داروها و واکسنهایی که در برابر سویههای نوظهور مؤثر باشند، کمک کند.
مقایسه MAFFT با سایر الاینرها و انتخاب ابزار مناسب
MAFFT در مقایسه با ابزارهای قدیمیتر مانند ClustalW، سرعت و دقت بالاتری ارائه میدهد. در حالی که MUSCLE نیز سریع است، استراتژیهای دقیق MAFFT مانند L-INS-i نتایج بهتری تولید میکنند. T-Coffee در برخی موارد دقیقتر است اما بسیار کندتر عمل میکند و برای مجموعه دادههای بزرگ مناسب نیست. مطالعات نشان میدهند که استراتژیهای دقیق MAFFT در رتبهبندی دقت بالا و روشهای سریع آن با ابزارهای کارآمدی مانند Kalign رقابت میکنند.
انتخاب ابزار مناسب به عواملی چون نوع، تعداد، طول و شباهت توالیها بستگی دارد. مثلا، برای توالیهای بسیار طولانی، ابزارهایی مانند Mauve یا MUMmer مناسبترند. برای توالیهای با شباهت کم، ProbCons یا PROMALS نتایج بهتری ارائه میدهند. برای حفظ ساختار ثانویه RNA، ابزارهایی چون SINA یا MXSCARNA توصیه میشوند. همچنین برای مجموعه دادههای عظیم، MAFFT-DASH یا UPP کارآمدتر هستند. در نهایت، مقایسه نتایج چندین ابزار میتواند بهترین رویکرد باشد.
جمع بندی و آینده MAFFT
MAFFT با ترکیب سرعت و دقت، به استانداردی در همترازسازی چندگانه توالی (MSA) تبدیل شده و با نوآوریهایی چون FFT، سرعت تحلیل را به طور چشمگیری افزایش داده است. این نرمافزار با تکامل مداوم و افزودن قابلیتهای تخصصی، همچنان پاسخگوی نیازهای بیوانفورماتیک مدرن است. با افزایش حجم دادهها، تمرکز آینده بر مقیاسپذیری، بهینهسازی الگوریتمی و بهرهگیری از یادگیری عمیق و محاسبات موازی خواهد بود. تسلط بر MAFFT مهارتی کلیدی برای محققان علوم زیستی است تا بتوانند در عصر انقلاب ژنومیک، به درک عمیقتری از تنوع زیستی دست یابند.
سوالات متداول درباره MAFFT
MAFFT ابزاری قدرتمند در بیوانفورماتیک است که برای همترازسازی چندگانه توالیهای DNA ، RNA و پروتئین به کار میرود و به درک روابط تکاملی و الگوهای بیولوژیکی کمک میکند.
MAFFT استراتژیهای متنوعی مانند G-INS-i (برای شباهت سراسری)، L-INS-i (برای شباهت محلی) و FFT-NS-1/2 (برای سرعت بالا در دادههای حجیم) را ارائه میدهد تا کاربران بتوانند بهترین گزینه را برای نیاز خود انتخاب کنند.
بله، MAFFT دارای یک رابط کاربری آنلاین (Web server) است که به کاربران اجازه میدهد بدون نیاز به نصب، توالیهای خود را به صورت مستقیم در وبسایت بارگذاری و الاین کنند.
بله، MAFFT نرمافزار قابل نصب هم دارد و پس از دانلود و نصب بر روی سیستم شخصی، میتوان از آن به صورت آفلاین و بدون نیاز به اتصال اینترنت استفاده کرد.
بله، MAFFT بهصورت رایگان در دسترس است و نسخه نرمافزاری آن را میتوان برای استفاده آفلاین بدون پرداخت هزینه دریافت و نصب کرد. همچنین نسخه آنلاین MAFFT نیز معمولاً بهصورت رایگان از طریق وبسرور رسمی در دسترس است و برای الاینمنت سریع توالیها قابل استفاده است.



