Autarchy of the Private Cave

Tiny bits of bioinformatics, [web-]programming etc

    • Archives

    • Recent comments

    Amazonia! 6462 human microarray datasets

    6th March 2011

    Amazonia!Amazonia! – explore the jungle of microarray results

    Paradoxically, the tremendous downpour of microarray results prevents a simple use of expression data. Therefore, we propose a thematic entry to public transcriptomes: you may for instance query a gene on a “Stem Cells page”, where you will see the expression of your favorite gene across selected microarray experiments related to stem cell biology. This selection of samples can be customized at will among the 6462 samples currently present in the database.

    Every transcriptome study results in the identification of lists of genes relevant to a given biological condition. In order to include this valuable information in any new query in the Amazonia! database, we indicate for each gene in which lists it is included. This is a straightforward and efficient way to synthesize hundreds of microarray publications.

    A special feature of Amazonia! is the field of human stem cells, notably embryonic stem cells.


    Posted in Bioinformatics, Links, Science | No Comments »

    Overlaying gene expression data onto pathways from databases

    5th November 2010

    Superimposing gene expression data onto pathways from databases is a common task in the final steps of microarray data analysis – that is, biological interpretation and results discussion.

    I have found many tools which claim to facilitate this procedure. Some of them are reviewed below (in no specific order).
    Read the rest of this entry »


    Posted in Bioinformatics, Links, Software | No Comments »

    Вірний переклад українською терміну microarray (post in Ukrainian)

    26th May 2010

    Викладену нижче власну позицію вважаю найправильнішою (і використовую з 2007 року).

    Префікс мікро в українській мові є, і позначає певну кратність (10-6) числової величини (а також просто щось маленьке) – тому його можна зберегти при перекладі першої половини складного слова microarray. Цей префікс також входить до системи одиниць СІ.

    А от слова арей (як вживають деякі автори) в українській мові немає. Також немає сенсу його запозичувати, оскільки існують переклади (слова-еквіваленти). Один зі словників пропонує такі варіанти перекладу слова array українською (у різних контекстах):

    • множина, набір, комплект
    • розташування, решітка, сітка
    • масив, список, поле, ряд
    • решітка даних
    • масив даних
    • матриця

    Я пропоную використовувати термін мікромасив (та похідний від нього мікромасив-експеримент). Цей термін має перевагу над вживаним у Російській Федерації “микрочип-экспериментом”, оскільки “мікрочіп” або просто “чіп” – це усталений термін електроніки, де він позначає кремнієвий електронний елемент з високим ступенем упаковки напівпровідників; натомість “масив” – це і набір/список [даних], и [двомірна] матриця [даних/ознак/зондів/будь-чого]. Відповідно, мікромасив – це маленька матриця або маленький набір [олігонуклеотидних/кДНК зондів]. Додатковим аргументом проти використання слова чіп вважаю його запозиченість.

    Використання інших варіантів перекладу слова array або не відповідає суті об’єкту, або має неоднозначне трактування. Наприклад, мікроматриця: в молекулярній біології матриця – це ланцюг ДНК, з якого іде синтез, а в ширшому значенні – взагалі будь-яка модель, з якої виготовляють зразки. (Звичайно, слово матриця також є синонімом слова масив у значенні двомірний масив / двомірна матриця, але слово масив не має – наскільки мені відомо – альтернативних трактувань у молекулярній біології). Розглядати інші варіанти перекладу слова array не вважаю за потрібне, оскільки вони ще менш вдалі за матрицю.

    Таким чином, вірним перекладом терміну microarray є слово мікромасив.


    Posted in Misc, Science, Ukraine | No Comments »

    R script to filter probesets with log-expression values below the lowest spike-in

    27th January 2010

    Sometimes there is a need to remove all the probesets, which have expression values below the minimal spike-in intensity on the Affymetrix microarray. The reasoning behind this procedure is simple: minimal-expression spike-ins represent the bottom margin of microarray sensitivity, and anything below that margin cannot be reliably quantified – which also means that both fold-change and p-value of expression variance will be unreliable for these probesets.

    Here’s a simple R script to do just that. It is abundantly commented, and also contains an optional (commented out) fragment which allows the removal of more low-variance, low-intensity probesets.

    Read the rest of this entry »


    Posted in Bioinformatics, Programming, Science | No Comments »

    Gene regulatory network reconstruction from microarray data

    20th May 2008

    The title of this post is my current – “forthcome”, as in “done” – field of interest.

    First article on topic: Fast network component analysis (FastNCA) for gene regulatory network reconstruction from microarray data.

    Another one, on combining different high-throughput data sources to get higher-quality results: Uncovering signal transduction networks from high-throughput data by integer linear programming.

    I’m especially interested in time-series network reconstruction algorithms. If you have a good advice to share with a newcomer to the networks field – don’t hesitate :)


    Posted in Bioinformatics, Links, Science | No Comments »