EconPapers    
Economics at your fingertips  
 

Discovering Statistically Significant Periodic Gene Expression

Jie Chen and Kuang‐Chao Chang

International Statistical Review, 2008, vol. 76, issue 2, 228-246

Abstract: One frequent application of microarray experiments is in the study of monitoring gene activities in a cell during cell cycle or cell division. High throughput gene expression time series data are produced from such microarray experiments. A new computational and statistical challenge for analyzing such gene expression time course data, resulting from cell cycle microarray experiments, is to discover genes that are statistically significantly periodically expressed during the cell cycle. Such a challenge occurs due to the large number of genes that are simultaneously measured, a moderate to small number of measurements per gene taken at different time points and high levels of non‐normal random noises inherited in the data. Computational and statistical approaches to discovery and validation of periodic patterns of gene expression are, however, very limited. A good method of analysis should be able to search for significant periodic genes with a controlled family‐wise error (FWE) rate or controlled false discovery rate (FDR) and any other variations of FDR, when all gene expression profiles are compared simultaneously. In this review paper, a brief summary of currently used methods in searching for periodic genes will be given. In particular, two methods will be surveyed in details. The first one is a novel statistical inference approach, the C & G Procedure that can be used to effectively detect statistically significantly periodically expressed genes when the gene expression is measured on evenly spaced time points. The second one is the Lomb–Scargle periodogram analysis, which can be used to discover periodic genes when the gene profiles are not measured on evenly spaced time points or when there are missing values in the profiles. The ultimate goal of this review paper is to give an expository of the two surveyed methods to researchers in related fields. Une application fréquente des expériences de microréseaux se trouve dans l'étude du suivi des activités du gène pendant le cycle cellulaire ou la division cellulaire. Des séries temporelles d'expression de gènes à haut débit sont produites à partir de telles expériences. Un nouveau défi, informatique et statistique, pour analyser de telles données temporelles d'expression génétique, résultant des expériences de microréseaux du cycle cellulaire, est de découvrir les gènes qui, statistiquement et significativement, sont exprimés périodiquement durant le cycle cellulaire. Un tel défi apparaît en raison du grand nombre de gènes mesurés simultanément, d'un nombre modéréà faible de mesures par gène prises à différents moments et de hauts niveaux de bruits aléatoires non normaux dans les données. Les approches quantitatives et statistiques pour la découverte et la validation des modèles périodiques d'expression génétique sont cependant très limitées. Une bonne méthode d'analyse devrait être capable de rechercher des gènes périodiques significatifs avec un taux d'erreur par famille (FWE) contrôlé, ou un taux de fausse découverte (FDR) contrôlé et d'autres variations de ce taux, quand tous les profils d'expression génétique sont comparés simultanément. Dans cet article récapitulatif, un bref résumé des méthodes actuellement utilisées pour la recherche des gènes périodiques sera donné. En particulier, deux méthodes seront analysées en détail. La première est une approche originale d'inférence statistique, la procédure C&G qui peut être utilisée pour détecter efficacement des gènes exprimés périodiquement, statistiquement et significativement, quand l'expression du gène est mesurée à des moments espacés uniformément. La seconde est l'analyse par périodogramme de Lomb‐Scargle, qui peut être utilisée pour découvrir des gènes périodiques quand les profils génétiques ne sont pas mesurés à des moments régulièrement espacés ou quand il y a des valeurs manquantes dans les profils. Le dernier objectif de cet article est d'exposer les deux méthodes aux chercheurs dans les champs concernés.

Date: 2008
References: View references in EconPapers View complete reference list from CitEc
Citations:

Downloads: (external link)
https://doi.org/10.1111/j.1751-5823.2008.00048.x

Related works:
This item may be available elsewhere in EconPapers: Search for items with the same title.

Export reference: BibTeX RIS (EndNote, ProCite, RefMan) HTML/Text

Persistent link: https://EconPapers.repec.org/RePEc:bla:istatr:v:76:y:2008:i:2:p:228-246

Ordering information: This journal article can be ordered from
http://www.blackwell ... bs.asp?ref=0306-7734

Access Statistics for this article

International Statistical Review is currently edited by Eugene Seneta and Kees Zeelenberg

More articles in International Statistical Review from International Statistical Institute Contact information at EDIRC.
Bibliographic data for series maintained by Wiley Content Delivery ().

 
Page updated 2025-03-19
Handle: RePEc:bla:istatr:v:76:y:2008:i:2:p:228-246