1  Introdução ao R e R Studio

Quando finalizar este capítulo, deverá ser capaz de:

Objetivos de aprendizagem
  • Descrever o objetivo e as funções dos painéis disponíveis no RStudio.
  • Compreender as diferenças entre erros, avisos e mensagens no R.
  • Executar código em R diretamente através do editor de scripts.
  • Documentar o código utilizando comentários.
  • Guardar o código num script.

 

1.1 Instalar o R e o R Studio

O R é uma linguagem de programação de código aberto direcionada para a análise estatística e para a visualização de dados, criada por Ross Ihahka e Robert Gentleman na Universidade de Auckland em 1993.

O RStudio é um ambiente de desenvolvimento integrado criado por J.J. Allaire in 2009. O RStudio é o programa que permite a utilização do R através de uma interface mais simples e acessível, com muitas funcionalidades adicionais.

Durante as aulas de DECIDES I (e II), iremos utilizar o R através do RStudio. Para instalar ambos no seu computador pessoal, poderá fazer download dos mesmos na página da posit, a empresa que gere o RStudio. Nos computadores das salas de aula, o R e o RStudio já se encontram instalados.

1.2 Abrir o R e o R Studio

Depois de ter o R e o RStudio instalados, pode abrir o RStudio clicando no ícone .

O R abre-se automaticamente quando abrimos o RStudio. Da primeira vez que abrir o RStudio, verá os seguintes três painéis(Figure 1.1):

Figure 1.1: Captura de ecrã do RStudio Screenshot com três painéis.

Os três painéis que dividem o ecrã são:

  1. o Painel da Consola à esquerda, que permite executar código em R imediatamente.

  2. o Painel do Ambiente no canto superior direito, onde pode aceder ao seu “ambiente de trabalho” e ao histórico, entre outros.

    • O Separador do Ambiente mantém um registo dos objetos criados à medida que trabalha no R (mais informações posteriormente).

    • O Separador de Histórico grava todos os comandos executados durante a sessão.

  3. o Painel de Output no canto inferior direito, que inclui:

    • O Separador de Gráficos, que mostra gráficos gerados durante a análise de dados. Note que existem setas que lhe permitem navegar no histórico de gráficos gerados. Pode clicar no ícone de vassoura para apagar todos os gráficos.

    • O Separador de Pacotes, que lista todos os pacotes do R atualmente instalados no seu computador e indica ainda se estes estão ou não carregados (mais informações posteriormente).

    • O Separador de Ajuda permite-lhe aceder a documentação útil sobre as funções utilizadas no R.

Ao longo desta e de outras aulas, irá compreender melhor a função de cada um destes elementos.

Prompt de comando  >

Note que a Consola começa com informações sobre a versão do R, licença, assim como algumas dicas sobre como obter ajuda. A última linha é uma prompt de comando (o símbolo “maior do que” >), que lhe indica que o R se encontra a aguardar por instruções suas sobre como proceder.

 

Vamos começar por utilizar o R como calculadora. Escreva 14 + 16 em frente ao prompt de comando na Consola e pressione Enter :

14 + 16
[1] 30

Pode ver na consola que o resultado (ou output) é [1] 30. Obviamente, 30 é o resultado do cálculo 14 + 16. Mas o que significa o [1]? É apenas o número índice do primeiro item de cada linha. (Não é esperado que compreenda nesta fase. No futuro, verá exemplos em que o resultado é, por exemplo, uma sequência de números com várias linhas. O número dentro de parênteses retos ajuda-nos a localizarmo-nos na sequência.)

1.3 Erros, avisos, e mensagens no R

Vamos escrever a palavra olá na Consola e clicar em Enter:

olá

Obtemos o erro seguinte:
Error: object ‘olá’ not found

O R mostra na Consola que alguma coisa inesperada aconteceu em três situações distintas:

  • Erros (Errors): Quando há um erro, a execução do código para e o R reporta informação relativamente ao erro.

  • Avisos (Warnings): Quando existe um aviso, o código é executado normalmente, mas podem existir problemas.

  • Mensagens (Messages): Muitas das vezes, o output associa-se a mensagens que podem ser úteis para o utilizador, mas que não são erros nem avisos.

Agora, escreva o seguinte na Consola:

14 + 16 -
+

Quando um comando no R não está completo, aparece uma prompt com o sinal mais (+) na segunda linha da consola (e linhas subsequentes) até corrigir a sintaxe. No nosso exemplo, podemos simplesmente escrever um número para terminarmos a expressão matemática que pretendíamos calcular. Também podemos utilizar a tecla Escape Esc para cancelar a execução do comando.

Quando vê o sinal +:

Tal como explicado, o sinal + no início da linha da consola (em lugar do sinal >) significa que o R está à espera que lhe dê mais instruções; ou seja, o seu comando anterior não estava completo. Como poderá ter a oportunidade de se aperceber no futuro, isto acontece frequentemente por ausência de fecho de parênteses ()) ou de aspas (").

Navegar no histórico na Consola

Para navegar entre comandos previamente executados na Consola, pode utilizar a seta para cima (\(\uparrow\)) ou para baixo (\(\downarrow\)) do seu teclado.

1.4 Criar um novo script

Normalmente, recomenda-se que escreva o código num ficheiro de script do R. Um script do R é um simples ficheiro de texto com a extensão .R onde o código é guardado e que pode ser executado na consola.

Vantagens de escrever o código num script

  • Permite a execução de um conjunto grande de código ao invés de executar uma linha de código de cada vez.
  • Permite guardar o código e a sua reutilização.
  • Permite documentar o código com comentários, usando o símbolo de cardinal ou hashtag, #.
  • Permite partilhar o código com outros.

No menu do RStudio, vá a:

flowchart LR
  A(File) -.-> B(New File) -.-> C(R Script)


Figure 1.2: Abrir um novo script do R no menu do RStudio.

Abre-se um novo painel, o “Editor de Scripts”, à esquerda, sobre a Consola (Figure 1.3). No Editor de Scripts, pode escrever código extenso e guardar o ficheiro para reutilização futura (para já, o novo script do R que ainda não foi guardado chama-se “Untitled 1”).

Figure 1.3: Captura de ecrã do RStudio com quatro painéis.

Pode alterar o tamanho dos painéis clicando nos botões de minimizar ou maximizar no canto superior direito de cada painel, ou clicando e arrastando as bordas dos painéis.

Agora, vamos escrever 14 + 16 no novo script do R e clicar no botão 1. O resultado surge na Consola(Figure 1.4):

  • 1 Num script .R, é possível executar o código linha a linha (colocando o cursor do rato na linha que queremos executar) ou selecionar um conjunto grande de linhas e clicar no botão Run no topo do editor. Também é possível executar o código utilizando as teclas Ctrl+Enter em Windows/Linux ou Cmd+Enter em Mac.

  • Figure 1.4: É possível escrever o código no editor de scripts e obter o resultado na consola, clicando em “Run”.

    Também pode utilizar Comentários para documentar o código e torná-lo mais legível (Figure 1.5).

    Figure 1.5: Script com comentários.

    Os comentários começam com o símbolo #. Ao executar o código, o R ignora todas as linhas que começarem com #.

    Por fim, pode guardar o seu script, indo a:

    flowchart LR
      A(File) -.-> B(Save As...)
    

    Aí, poderá dar um nome ao ficheiro (por exemplo, “o_meu_script”) e escolher uma localização para guardar o script.