Форум 3DNews
Вернуться   Форум 3DNews > Old over time > TSC! Russia

 
 
Опции темы Опции просмотра
Непрочитано 16.02.2011, 19:26   [включить плавающее окно]   #1
Behc
Мужской TSC
Автор темы
 
Аватар для Behc
 
Регистрация: 14.02.2011
Адрес: Петербург
[TSC!] Rosetta@Home: обсуждение

Обсуждаем проект Rosetta@Home.
Все вопросы задавать только после прочтения
FAQ по проекту Rosetta@Home
(обновлен 16.02.2011)

официальный сайт проекта
наша команда номер 528.
скачать BOINC клиент. (Windows, OS X, Linux)

Альтернативная статистика команды

Добавлено через 12 минут

FAQ по проекту Rosetta@Home

Научная сторона дела:

Цель проекта - решение одной из самых больших проблем в молекулярной биологии - вычисление 3-х мерной структуры белков из их аминокислотных последовательностей. Благодаря недавно завершенному проекту "Геном человека" известны аминокислотные последовательности всех белков в человеческом организме. Исследования по данному проекту также помогут в проектировании новых, не существующих белков. В случае успешного решения данных проблем мы сможем бороться с такими болезнями как рак, малярия, болезнь Альцгеймера, сибирская язва и другими генетическими и вирусными заболеваниями.

По сути Rosetta - это компьютерная программа для поиска:
- структуры с наименьшей энергией для заданной аминокислотной последовательности для предсказания структуры белка,
- обратная задача - поиск аминокислотной последовательности с наименьшей энергией для заданной белковой структуры;
а также расчета взаимодействия комплекса белок-белок.
В данном проекте используется обратная связь по прогнозированию и полученным результатам, чтобы улучшать потенциальные функции и алгоритмы поиска.

Rosetta строилась на основе нескольких идей, развиваемых несколькими группами, которые потом объединили усилия.
Вот эти идеи
0. 3D структура белка полностью определяется 1D последовательностью.
1. Знание вторичной структуры сильно облегчает жизнь при предсказании 3D.
2. Нужен промежуточный набор блоков из которых можно строить белок для преодоления комбинаторного взрыва (эти блоки потом были названы мотивами)
3. Необходимо построить функцию пригодности смоделированной структуры достаточно хорошо описывающую свободную энергию белка в физиологическом растворе.
4. Поиск оптимальной конфигурации нужно вести, как минимум, в две стадии - на гладком потенциале для больших блоков, а затем на полноатомном потенциале.
5. Молекулярная динамика подходит только для заключительной полноатомной шлифовки, на начальных стадиях необходимо использовать методы Монте-Карло и генетические алгоритмы.
6. Самый компактный кластер решений в пространстве построенном по метрике RMSD обычно содержит правильное решение.

Официальный сайт проекта
Авторы: лаборатория доктора Дэвида Университета Вашингтона
Результаты проекта

статьи про Розетту на русском языке
спасибо Alexa за перевод и lusvladimir за статью
Что мы хотим знать о проекте Rosetta@Home?
Научный FAQ по проекту
комментарии Дэвида Бейкера "Исследование Болезней".

Техническая сторона дела:
Поддерживаемые операционные системы:
Windows - Windows 98/ME/2000/XP/Vista
Macintosh - Mac OS X 10.3.9, или выше
Linux (32-bit/64-bit)
Системные требования
оперативная память занимаемая клиентом: от 200 Мб на ядро CPU.

Трафик - одна из крупных проблем проекта. При первом подключении вам необходимо скачать собственно boinc клиент (ссылка чуть ниже), размером около 10 Мб и файлы Розетты размером около 20 Мб. но, кроме этого надо закачивать и задания. И с ними трафик может достигать 20Мб в день на мощной машине. Для того, чтобы избежать такого трафика надо пройти по этой ссылке и в поле Target CPU run time поставить 1 days. После этого считать Розетту можно будет, даже если у вас диал-ап. Задание, размером около 5Мб будет считаться сутки и за это время трафик тратиться не будет. Результат, загружаемый на сервер имеет размер примерно 3-8 мегабайт.
В данный момент ведутся работы над дальнейшим снижением трафика.
Ещё один метод борьбы с повышенным трафиком Розетты от lusvladimir:
Цитата
Я вот провел тут небольшое исследование (проверил архивы своей папки BOINC за последние 20 дней) и убедился в том, что базовые файлы, которые мы качаем для расчета WU Rosetta, (см. мой предыдущий пост) - (это *._09_05.400_v1_3 и *._03_05.400_v1_3) - файлы АБСОЛЮТНО ИДЕНТИЧНЫ, а для расчетов используются изменяемые файлы .psipred_ss2, .pdb и .fasta. Я сижу на dial-up и у меня на машине давно уже стоит локальный кэширующий прокси-сервер (CoolProxy) для того, чтобы при серфинге заново не закачивать неизменяемые части сайтов. Но прога может и файлы тоже кэшировать!, я в настройках BOINC-клиента указал адрес моего локального прокси (127.0.0.1), на прокси стоит что нужно закачивать только те файлы, которые изменились, и я теперь получаю только маленький трафик расчетной части. Работаю на этой системе пока неделю, глюков и сбоев кроме самих Rosett'овских замечено не было.
Режим обновления - у меня стоит определеный пользователем.

Настройки - все настройки.
Пользователи (127.0.0.1)
Время для повторного обновления (сек) -30
Игнорировать дату и размер файла на сервере при обновлении - НЕТ
Обновление HTML- Всегда
Обновление прочих - Всегда
Обновление скриптов - Всегда

P.S У меня довольно старая версия 2.0 build 1023, так что может что-то по другому называться...

P.P.S Да, вот еще что: эффект от этой системы проявится как Вы понимаете, не сразу, нужно чтобы как минимум 1 раз вышеописанные базовые файлы прошли через прокси, а вот уже при втором и последующих обращениях к серверу проекта прокси не будет качать заново файл из Сети, а отдаст BOINC'у файл из своего кэша (из папки на локальном диске). Вот Вам и экономия трафика!
Избыточность: в проекте равна 1. То есть, одно задание выдается только одному участнику, а не четырем как обычно в боинк-проектах.

Как считаются кредиты?
Цитата
1. Claimed credit = (whetstone + dhrystone)*Tвычислений/1728000.
Где:
whetstone - скорость вычислений с плавающей точкой (FLOPS/s). (Например - 1785 миллионов/сек).
dhrystone - скорость вычислений с целыми числами (например - 3075 миллионов/сек).
Tвычислений - измеряется в секундах.

2. Теперь давайте разберёмся, откуда взялся коэффициент 1728000:
Как уже говорилось выше, объём вычислений V0 можно записать как: V0 = (Whetstone + Dhrystone)*T
В тоже время, согласно определению:
1 Cobblestone = (1GFLOPS/s + 1GINTOPS/s) *24 часа * 3600 секунд /100 = 2 GigaOPS/s * 24 * 3600 / 100 = 1728 GigaOPS/s
Тогда, выражая объём вычислений в Cobblestones мы получим:
V = V0/(1 Cobblestone) = (Whetstone + Dhrystone)*T/1728GigaOPS/s.
Поскольку результаты бенчмарков принято записывать в миллионах операций в секунду, то приставку Giga мы заменяет на 1000, а миллионы операций в секунду просто отбрасываем - поскольку они сокращаются и сверху (Whetstone + Dhrystone) и снизу (GigaOPS/s = 1000 MegaOPS/s).
3. как считается Recent Average Credit (RAC), написано тут http://boinc.berkeley.edu/credit.php
Как присоединиться к проекту?
1. Создать свой аккаунт, пройдя по этой ссылке
2. Если вы еще не участвовали в боинк проектах, скачать последнюю версию Boinc для Вашей операционной системы.
3. Запускаете клиент, идете в меню Проекты -> Добавить проект
4. Вводите адрес проекта http://boinc.bakerlab.org/rosetta
5. Говорите, что у вас уже есть аккаунт (Вы создали его в п.1), вводите e-mail и пароль, который вы ввели, когда создавали аккаунт.
6. Для того, чтобы присоединиться к нашей команде, пройдите по этой ссылке и нажмите на кнопку Join.
Всё, вы теперь с нами!

Как работать с кешем заданий?
После регистрации
1. Заходим на собственную станицу (с главной страницы проекта выбрать Your account)
2. Выбираем View or edit general preferences
3. Находим Connect to network about every (determines size of work cache; maximum 10 days).
Если там стоит 0.1 - увеличиваем, т.к это число определяет размер кеша заданий (если задается дробное число, то писать с точкой, например 0.5, если указать 0,5 то задания могут не загружаться )


полезные ссылки:

Boinc Wiki:
http://boinc-doc.net/boinc-wiki/index.php

Неофициальная документация:
http://distributed.ru/wiki/boinc

Информеры:
http://boinc.mundayweb.com
http://www.boincstats.com/page/faq.php#3
http://www.boinc.dk/index.php?page=signatures

Статистика команды:
официальная и обновляющаяся в режиме реального времени
http://boinc.bakerlab.org/rosetta/te...php?teamid=528
неофициальная, запаздывающая, но с более широкими возможностями
http://www.boincstats.com/stats/user...100&or=&ti=528
http://www.boinc.dk/index.php?page=t...rah&teamid=528
http://www.boincsynergy.com/stats/te...28&project=rah
http://stats.kwsn.net/team.php?proj=rosetta&teamid=528
http://stats.free-dc.org/stats.php?p...j=rah&team=528
http://boinc.mundayweb.com/stats/tea...iew=528&prj=13

Быстрое руководство по Розетте и её графике:
http://boinc.bakerlab.org/rosetta/rah_graphics.php


русская версия официального FAQ по Розетте от lusvladimir

В составлении описания проекта были использованы материалы следующих людей:
blackbird, SwZ, lusvladimir, RosMag, citerra, Kapten Trumm, Gercog, RM, Agafonov_KY, norlang, -=SR=-, Alexa, Lexx-R, ShiZ, krasbars.

Создано на основе FAQ от ShiZ.

Последний раз редактировалось Behc; 16.02.2011 в 19:39.
Behc вне форума  
Конфигурация ПК
Ответить с цитированием
 

Метки
cruncher, r@h, rosetta@home, tsc!

Опции темы
Опции просмотра

Ваши права в разделе
Вы не можете создавать новые темы
Вы не можете отвечать в темах
Вы не можете прикреплять вложения
Вы не можете редактировать свои сообщения

BB коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.

Быстрый переход


Текущее время: 14:29. Часовой пояс GMT +3.


Powered by vBulletin® Version 3.8.4
Copyright ©2000 - 2023, Jelsoft Enterprises Ltd. Перевод: zCarot
Copyright © 2000-2017 3DNews. All Rights Reserved.
Администрация 3DNews требует соблюдения на форуме правил и законов РФ
Серверы размещены в Hostkey