Instruções secretas do ChatGPT vazam para usuários em brecha inesperada

Uma falha acidental revelou as diretrizes internas do ChatGPT.

por Ingra Bárbara
| Em 05/07/2024 às 10:49

Quem diria que um simples “oi” poderia, por um momento, desvendar as instruções secretas por trás do ChatGPT? A descoberta acidental de um usuário do Reddit revelou as diretivas que a OpenAI emprega para manter o chatbot em linha. Embora a brecha tenha sido rapidamente corrigida pela OpenAI, a situação levanta questões intrigantes sobre a interação entre inteligências artificiais e seus usuários.

Um quase ‘jailbreak’ do ChatGPT

A tentativa de “jailbreak” do ChatGPT não foi uma verdadeira fuga das limitações impostas pela OpenAI, mas ainda assim proporcionou um vislumbre dos bastidores. A revelação acidental ocorreu quando o ChatGPT, respondendo a um cumprimento casual, listou uma série de instruções que normalmente permanecem ocultas ao usuário. Essas instruções são destinadas a orientar o comportamento do chatbot em uma variedade de situações, garantindo que ele opere dentro de parâmetros seguros e éticos.

A peculiaridade do ocorrido gerou bastante discussão em plataformas como o Reddit, onde um usuário compartilhou detalhes sobre como conseguiu replicar o evento, pedindo diretamente ao ChatGPT para listar suas instruções exatas. Algumas pessoas inclusive afirmaram ter conseguido replicar o mesmo comportamento da ferramenta. A brecha, no entanto, parece ter sido corrigida pela OpenAI logo após se tornar pública.

As instruções expostas abrangem desde a geração de imagens com Dall-E, uma ferramenta da OpenAI, até as condições específicas sob as quais o ChatGPT pode acessar a internet. Por exemplo, a IA só pode criar uma imagem por pedido e deve evitar violar direitos autorais nas imagens que produz.

Além disso, as instruções para a funcionalidade de navegador do sistema delimitam claramente quando e como o ChatGPT pode acessar a internet, com diretrizes específicas para a seleção de fontes e a abertura de URLs.

Algumas das instruções do ChatGPT

Você consegue acessar as instruções completas diretamente no Reddit, porém separamos algumas que nos chamaram a atenção:

Sobre navegadores (browsers):

Você tem a ferramenta ‘browser’. Use ‘browser’ nas seguintes circunstâncias:

  • O usuário está perguntando sobre eventos atuais ou algo que requer informações em tempo real (clima, placares de esportes, etc.)
  • O usuário está perguntando sobre algum termo com o qual você não está familiarizado (pode ser novo)
  • O usuário pede explicitamente para você navegar ou fornecer links para referências.

Dada uma consulta que requer recuperação, sua resposta consistirá em três etapas:

  • Chame a função de pesquisa para obter uma lista de resultados.
  • Chame a função ‘mclick’ para recuperar um subconjunto diversificado e de alta qualidade desses resultados (em paralelo). Lembre-se de SELECIONAR PELO MENOS 3 fontes ao usar ‘mclick’.
  • Escreva uma resposta ao usuário baseada nesses resultados. Em sua resposta, cite fontes usando o formato de citação abaixo.
  • Em alguns casos, você deve repetir o passo 1 duas vezes, se os resultados iniciais forem insatisfatórios e você acreditar que pode refinar a consulta para obter melhores resultados.

Você também pode abrir uma URL diretamente se uma for fornecida pelo usuário. Use apenas o comando ‘open_url’ para esse propósito; não abra URLs retornadas pela função de pesquisa ou encontradas em páginas da web.

Sobre códigos em Python

Quando você enviar uma mensagem contendo código Python para python, ela será executada em um ambiente de notebook Jupyter.

O python responderá com o resultado da execução ou expirará após 60,0 segundos.

O drive em ‘/mnt/data’ pode ser usado para salvar e manter arquivos do usuário.

O acesso à internet nesta sessão está desabilitado. Não faça solicitações externas de web ou chamadas de API, pois elas falharão.

Use ace_tools.display_dataframe_to_user(nome: str, dataframe: pandas.DataFrame) -> None para apresentar visualmente DataFrames do pandas quando isso beneficiar o usuário.

Ao fazer gráficos para o usuário: 1) nunca use seaborn, 2) dê a cada gráfico seu próprio espaço distinto (sem subplots), e 3) nunca defina cores específicas – a menos que explicitamente solicitado pelo usuário.
REPITO: ao fazer gráficos para o usuário: 1) use matplotlib em vez de seaborn, 2) dê a cada gráfico seu próprio espaço distinto (sem subplots), e 3) nunca, jamais, especifique cores ou estilos do matplotlib – a menos que explicitamente solicitado pelo usuário.

Interessante, não é?

  • Ingra Bárbara

    Apaixonada por palavras e por transformar ideias em conteúdo envolvente. Exploro uma variedade de tópicos, desde notícias e entretenimento até curiosidades e ciência.

Tags: chatgpt | OpenAI

Recentes

8 recursos que tornam o Android 15 ainda mais seguro

8 recursos que tornam o Android 15 ainda mais seguro

A segurança dos dados e a privacidade do usuário tornam-se cada vez mais prioritárias, e o Android 15 chega ao mercado com uma série de novidades nessa frente. Essa nova versão traz uma solução aprimorada e integrada para enfrentar ameaças cibernéticas e...

Novo sistema Wi-Fi alcança quase 16 km de distância e bate recorde

Novo sistema Wi-Fi alcança quase 16 km de distância e bate recorde

Um novo sistema de Wi-Fi conseguiu atingir uma impressionante extensão de quase 16 quilômetros, o que pode abrir novas possibilidades para conectividade em áreas rurais e ambientes com baixa densidade de sinal. A proeza foi realizada pela Morse Micro, uma empresa que...

Ajuste uma configuração no Android e dobre a velocidade do celular

Ajuste uma configuração no Android e dobre a velocidade do celular

A busca por um celular mais rápido e eficiente é interminável para muitos usuários. Um truque pouco conhecido, mas extremamente útil, que consegue acelerar o seu dispositivo é ajustar a velocidade das animações no seu Android. Nesse sentido, com alguns toques e uma...

Réplica da McLaren P1 feita de LEGO roda no Circuito de Silverstone

Réplica da McLaren P1 feita de LEGO roda no Circuito de Silverstone

Lego surpreendeu mais uma vez ao criar uma réplica em tamanho real do McLaren P1, um hipercarro icônico. No total, foram utilizadas mais de 342.817 peças Technic. Mas o grande diferencial mesmo é que esta impressionante construção não é apenas um modelo estático; é um...

Chatbots podem reduzir crença em teorias da conspiração, diz estudo

Chatbots podem reduzir crença em teorias da conspiração, diz estudo

Com a internet facilitando a disseminação de teorias da conspiração, algumas inofensivas e outras com potencial para causar grandes danos, pesquisadores estão explorando novas estratégias para combater esse problema. Uma recente pesquisa realizada por especialistas do...

4 opções baratas de carros automáticos atualmente – seu preços!

4 opções baratas de carros automáticos atualmente – seu preços!

Se você está buscando praticidade na direção, um carro automático pode ser uma excelente opção. E, no Brasil, com o aumento da demanda por esse tipo de câmbio, as montadoras estão cada vez mais se empenhando para oferecer modelos automáticos a preços acessíveis. A...

Uso do ChatGPT pode prejudicar desempenho de estudantes, aponta estudo

Uso do ChatGPT pode prejudicar desempenho de estudantes, aponta estudo

Um estudo conduzido por pesquisadores da Universidade da Pensilvânia revelou que o uso do ChatGPT como ferramenta de apoio no aprendizado pode, na verdade, prejudicar o desempenho dos alunos em testes. Duvida disso? Bom, a pesquisa, que envolveu estudantes do ensino...

Este modelo pode acabar com as imagens estranhas criadas por IA

Este modelo pode acabar com as imagens estranhas criadas por IA

A geração de imagens por inteligência artificial (IA) sempre enfrentou dificuldades em criar resultados consistentes, frequentemente cometendo erros bizarros em detalhes como dedos e simetria facial. Além disso, esses modelos podem falhar completamente quando...

iPhone 16: Quantos salários mínimos são necessários para comprar um?

iPhone 16: Quantos salários mínimos são necessários para comprar um?

O lançamento do iPhone 16 no Apple Event gerou grande expectativa, pelas suas novas funções e design, além do preço. Só para ilustrar, aqui no Brasil, o valor de venda deve chegar a quase R$ 8 mil! Por isso, surge uma pergunta: quantos salários mínimos compram o novo...