Skip to main content
Jornal Brasileiro de Pneumologia logoLink to Jornal Brasileiro de Pneumologia
. 2016 Jan-Feb;42(1):77. doi: 10.1590/S1806-37562016000000013
View full-text in Portuguese

What is survival analysis, and when should I use it?

Juliana Carvalho Ferreira 1,2, Cecilia Maria Patino 2,3
PMCID: PMC4805395  PMID: 26982049

INTRODUCTION

Researchers used a national registry of lung cancer patients in the United States to identify the impact of tumor size and histological type on patient survival. They included 7,965 patients treated between 1988 and 2000. As can be seen in Figure 1, they found that survival times were shorter among the patients with larger tumors (> 5 cm) than among those with smaller tumors (< 1 cm).

Figure 1. Survival for participants with larger tumors (> 5 cm, solid line) and for those with smaller tumors (< 1 cm, dotted line). Adapted from Ost et al. (Recommended reading).

Figure 1.

The misconception that mortality and survival are interchangeable comes from the lay use of the terms. However, in biostatistics, survival is a concept derived from a specific analytical procedure, whereas mortality is a dichotomous outcome variable usually compared between or across two or more groups at a specific time point (for example, at five years). Survival, in turn, deals with a time-to-event variable: it measures the time between the beginning of observation until the occurrence of an event.

WHY USE SURVIVAL ANALYSIS?

Survival analysis is important when the time between exposure and event is of clinical interest. In our example, five-year survival among patients with tumors < 1 cm was 85%, compared with 52% among those with tumors > 5 cm. Of the patients in that latter group (the high-risk group), approximately half were dead in five years. However, knowing that survival after two years was 70% is also clinically relevant. For highly lethal diseases, like metastatic cancer, a subgroup submitted to a new treatment might have a survival advantage in the first three years but similar mortality after five years. Comparing mortality at the end of the period does not distinguish between longer and shorter survival times.

Calculating survival is also useful for methodological reasons; for example, when study participants are lost to follow-up. When the study ends, investigators might not know if a given participant is dead or alive, but they know that he or she was alive at least until their last visit. In addition, some participants might be followed for less than five years because they enter the study at a later date. When the study ends, they might have not experienced the event because their follow-up was interrupted. In Figure 1, it can be seen that survival continues to decrease from two to five years. In survival analysis, data related to participants who did not experience the event by the end of the study or were lost to follow-up are censored: they contribute to the analysis up to the last point at which the investigators knew that the participants were still alive.

Survival analysis uses conditional probability; that is, the probability of surviving up to time t, given that a subject was alive at the beginning of a specified time interval. The Kaplan-Meier method is used in order to estimate survival probability at several time intervals and to graphically illustrate survival over time. The log-rank test is a nonparametric test used in comparing survival curves between two or more groups.

SOME INTERESTING FACTS ABOUT SURVIVAL

In survival analysis, censored data are not the same as missing data. Participants whose data are censored are not excluded and contribute time at risk to the analysis up to the last interval during which they were alive. Therefore, imputation methods are not needed.

Censoring due to loss to follow-up is only acceptable for a small percentage of cases and when the prognosis of participants lost to follow-up is assumed to be the same as those remaining in the study.

The outcome of survival analysis does not have to be time-to-death; it can be other time-to-event outcomes, such as time-to-pregnancy after fertility treatment and time-to-ventilator weaning.

RECOMMENDED READING

  • 1.Ost D, Goldberg J, Rolnitzky L, Rom WN. Survival after surgery in stage IA and IB non-small cell lung cancer. Am J Respir Crit Care Med. 2008;177(5):516–523. doi: 10.1164/rccm.200706-815OC. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 2.Glantz SA. Glantz SA. Primer in Biostatistics. 7. New York: McGraw-Hill Medical; 2011. How to analyse survival data; pp. 229–244. [Google Scholar]
J Bras Pneumol. 2016 Jan-Feb;42(1):77. [Article in Portuguese]

O que é análise de sobrevida e quando devo utilizá-la?

Juliana Carvalho Ferreira 1,2, Cecilia Maria Patino 2,3

INTRODUÇÃO

Pesquisadores utilizaram um registro nacional de pacientes com câncer de pulmão nos Estados Unidos para identificar o impacto do tamanho do tumor e do tipo histológico na sobrevida dos pacientes. Foram incluídos 7.965 pacientes tratados entre 1988 e 2000. Como se pode observar na Figura 1, constatou-se que os tempos de sobrevida foram mais curtos entre os pacientes com tumores maiores (> 5 cm) do que entre aqueles com tumores menores (< 1 cm).

Figura 1. Sobrevida para participantes com tumores maiores (> 5 cm, linha contínua) e para aqueles com tumores menores (< 1 cm, linha pontilhada). Adaptado de Ost et al. (Leitura recomendada).

Figura 1.

O conceito errôneo de que mortalidade e sobrevida são intercambiáveis vem do uso leigo dos termos. Porém, em bioestatística, sobrevida é um conceito derivado de um procedimento analítico específico, enquanto mortalidade é uma variável de desfecho dicotômica geralmente comparada entre dois ou mais grupos em um momento específico (por exemplo, em cinco anos). Sobrevida, por sua vez, constitui uma variável que relaciona tempo e evento: ela mede o tempo entre o início da observação até a ocorrência de um evento.

POR QUE UTILIZAR ANÁLISE DE SOBREVIDA?

A análise de sobrevida é importante quando o tempo entre exposição e evento é de interesse clínico. Em nosso exemplo, a sobrevida em cinco anos entre pacientes com tumores < 1 cm foi de 85%, contra 52% entre aqueles com tumores > 5 cm. Dos pacientes deste último grupo (o grupo de alto risco), aproximadamente metade estava morta em cinco anos. Porém, saber que a sobrevida após dois anos foi de 70% é também clinicamente relevante. Para doenças altamente letais, como o câncer metastático, um subgrupo submetido a um novo tratamento pode ter vantagem de sobrevida nos primeiros três anos, mas mortalidade semelhante após cinco anos. A comparação da mortalidade no final do período não discrimina entre tempos de sobrevida mais longos e mais curtos.

O cálculo de sobrevida também é útil por razões metodológicas; por exemplo, quando há perda de acompanhamento dos participantes do estudo. Quando o estudo termina, os investigadores podem não saber se um determinado participante está vivo ou morto, mas sabem que ele ou ela estava vivo pelo menos até a última consulta. Além disso, alguns participantes podem ser acompanhados durante menos de cinco anos porque eles entram no estudo em uma data posterior. Quando o estudo termina, eles podem não ter tido o evento porque o acompanhamento foi interrompido. Na Figura 1, pode-se observar que a sobrevida continua a diminuir de dois para cinco anos. Na análise de sobrevida, os dados referentes aos participantes que não desenvolveram o evento até o final do estudo ou tiveram perda de acompanhamento são censurados: eles contribuem para a análise até o último momento em que os investigadores sabiam que os participantes ainda estavam vivos.

A análise de sobrevida utiliza probabilidade condicional; ou seja, a probabilidade de sobreviver até o momento t, dado que o sujeito estava vivo no início de um intervalo de tempo especificado. O método de Kaplan-Meier é utilizado para estimar a probabilidade de sobrevida em vários intervalos de tempo e para ilustrar graficamente a sobrevida ao longo do tempo. O teste de log-rank é um teste não paramétrico utilizado na comparação de curvas de sobrevida entre dois ou mais grupos.

ALGUNS FATOS INTERESSANTES SOBRE SOBREVIDA

Na análise de sobrevida, dados censurados não são o mesmo que dados faltantes. Os participantes cujos dados são censurados não são excluídos e contribuem tempo sob risco para a análise até o último intervalo em que estavam vivos. Portanto, não são necessários métodos de imputação.

Censura por perda de acompanhamento só é aceitável para uma pequena porcentagem de casos e quando se assume que o prognóstico dos participantes com perda de acompanhamento é o mesmo daqueles que permaneceram no estudo.

O desfecho na análise de sobrevida não precisa ser tempo até a morte; pode ser outros desfechos do tipo tempo-até-evento, como tempo até engravidar após tratamento de fertilidade e tempo até desmame do ventilador.


Articles from Jornal Brasileiro de Pneumologia are provided here courtesy of Sociedade Brasileira de Pneumologia e Tisiologia (Brazilian Thoracic Society)

RESOURCES