Instruções secretas do ChatGPT vazam para usuários em brecha inesperada

Uma falha acidental revelou as diretrizes internas do ChatGPT.

por Ingra Bárbara
| Em 05/07/2024 às 10:49

Quem diria que um simples “oi” poderia, por um momento, desvendar as instruções secretas por trás do ChatGPT? A descoberta acidental de um usuário do Reddit revelou as diretivas que a OpenAI emprega para manter o chatbot em linha. Embora a brecha tenha sido rapidamente corrigida pela OpenAI, a situação levanta questões intrigantes sobre a interação entre inteligências artificiais e seus usuários.

Um quase ‘jailbreak’ do ChatGPT

A tentativa de “jailbreak” do ChatGPT não foi uma verdadeira fuga das limitações impostas pela OpenAI, mas ainda assim proporcionou um vislumbre dos bastidores. A revelação acidental ocorreu quando o ChatGPT, respondendo a um cumprimento casual, listou uma série de instruções que normalmente permanecem ocultas ao usuário. Essas instruções são destinadas a orientar o comportamento do chatbot em uma variedade de situações, garantindo que ele opere dentro de parâmetros seguros e éticos.

A peculiaridade do ocorrido gerou bastante discussão em plataformas como o Reddit, onde um usuário compartilhou detalhes sobre como conseguiu replicar o evento, pedindo diretamente ao ChatGPT para listar suas instruções exatas. Algumas pessoas inclusive afirmaram ter conseguido replicar o mesmo comportamento da ferramenta. A brecha, no entanto, parece ter sido corrigida pela OpenAI logo após se tornar pública.

As instruções expostas abrangem desde a geração de imagens com Dall-E, uma ferramenta da OpenAI, até as condições específicas sob as quais o ChatGPT pode acessar a internet. Por exemplo, a IA só pode criar uma imagem por pedido e deve evitar violar direitos autorais nas imagens que produz.

Além disso, as instruções para a funcionalidade de navegador do sistema delimitam claramente quando e como o ChatGPT pode acessar a internet, com diretrizes específicas para a seleção de fontes e a abertura de URLs.

Algumas das instruções do ChatGPT

Você consegue acessar as instruções completas diretamente no Reddit, porém separamos algumas que nos chamaram a atenção:

Sobre navegadores (browsers):

Você tem a ferramenta ‘browser’. Use ‘browser’ nas seguintes circunstâncias:

  • O usuário está perguntando sobre eventos atuais ou algo que requer informações em tempo real (clima, placares de esportes, etc.)
  • O usuário está perguntando sobre algum termo com o qual você não está familiarizado (pode ser novo)
  • O usuário pede explicitamente para você navegar ou fornecer links para referências.

Dada uma consulta que requer recuperação, sua resposta consistirá em três etapas:

  • Chame a função de pesquisa para obter uma lista de resultados.
  • Chame a função ‘mclick’ para recuperar um subconjunto diversificado e de alta qualidade desses resultados (em paralelo). Lembre-se de SELECIONAR PELO MENOS 3 fontes ao usar ‘mclick’.
  • Escreva uma resposta ao usuário baseada nesses resultados. Em sua resposta, cite fontes usando o formato de citação abaixo.
  • Em alguns casos, você deve repetir o passo 1 duas vezes, se os resultados iniciais forem insatisfatórios e você acreditar que pode refinar a consulta para obter melhores resultados.

Você também pode abrir uma URL diretamente se uma for fornecida pelo usuário. Use apenas o comando ‘open_url’ para esse propósito; não abra URLs retornadas pela função de pesquisa ou encontradas em páginas da web.

Sobre códigos em Python

Quando você enviar uma mensagem contendo código Python para python, ela será executada em um ambiente de notebook Jupyter.

O python responderá com o resultado da execução ou expirará após 60,0 segundos.

O drive em ‘/mnt/data’ pode ser usado para salvar e manter arquivos do usuário.

O acesso à internet nesta sessão está desabilitado. Não faça solicitações externas de web ou chamadas de API, pois elas falharão.

Use ace_tools.display_dataframe_to_user(nome: str, dataframe: pandas.DataFrame) -> None para apresentar visualmente DataFrames do pandas quando isso beneficiar o usuário.

Ao fazer gráficos para o usuário: 1) nunca use seaborn, 2) dê a cada gráfico seu próprio espaço distinto (sem subplots), e 3) nunca defina cores específicas – a menos que explicitamente solicitado pelo usuário.
REPITO: ao fazer gráficos para o usuário: 1) use matplotlib em vez de seaborn, 2) dê a cada gráfico seu próprio espaço distinto (sem subplots), e 3) nunca, jamais, especifique cores ou estilos do matplotlib – a menos que explicitamente solicitado pelo usuário.

Interessante, não é?

  • Ingra Bárbara

    Apaixonada por palavras e por transformar ideias em conteúdo envolvente. Exploro uma variedade de tópicos, desde notícias e entretenimento até curiosidades e ciência.

Tags: chatgpt | OpenAI

RECENTES

6 ajustes para fazer a bateria do seu Galaxy Watch durar mais

6 ajustes para fazer a bateria do seu Galaxy Watch durar mais

O Galaxy Watch - o relógio inteligente da Samsung - é um companheiro inteligente que facilita a rotina de quem o usa, mas muitos usuários percebem que sua bateria pode se esgotar mais rápido do que gostariam. Para aproveitar ao máximo seu relógio e estender a duração...

Senhas mais usadas de 2024: Evite-as para proteger seus dados!

Senhas mais usadas de 2024: Evite-as para proteger seus dados!

No mundo digital, onde senhas são a chave para praticamente tudo — desde contas bancárias até dispositivos inteligentes —, a escolha de combinações fáceis de lembrar pode se tornar uma grande vulnerabilidade. Um estudo da NordPass, especializado em gestão de senhas,...

5 vantagens da Bluesky em relação a outras redes sociais

5 vantagens da Bluesky em relação a outras redes sociais

Recentemente, a rede Bluesky tem se ganhado espaço como uma das opções mais comentadas entre redes sociais descentralizadas. Criada para oferecer maior controle aos usuários e eliminar a manipulação algorítmica, ela é vista como uma alternativa atrativa para quem...

Evite problemas! 7 cuidados fundamentais para sua geladeira

Evite problemas! 7 cuidados fundamentais para sua geladeira

Muitas vezes subestimamos o impacto de pequenos hábitos que, sem percebermos, podem comprometer o funcionamento da nossa geladeira e até mesmo sua durabilidade. Com isso em mente, preparamos um guia detalhado para te ajudar a cuidar melhor deste item essencial do dia...

Android 15: 7 novos modelos da Motorola têm update confirmado

Android 15: 7 novos modelos da Motorola têm update confirmado

Após o lançamento oficial do Android 15 em 15 de outubro, a Motorola confirmou a chegada da nova atualização do sistema operacional da Google para sete de seus dispositivos. Embora ainda não haja uma data específica para liberação, a empresa já incluiu novos modelos...

7 erros comuns ao trocar o pneu do carro – e como evitá-los!

7 erros comuns ao trocar o pneu do carro – e como evitá-los!

Trocar o pneu do carro pode parecer uma tarefa simples, até o momento em que você realmente precisa trocar um. Nessa hora, muitos motoristas cometem erros que podem comprometer a segurança e a integridade do veículo. Então, para te ajudar a entender melhor o que não...

Está de PC novo? 5 passos para configurar sua nova máquina!

Está de PC novo? 5 passos para configurar sua nova máquina!

Se você acabou de adquirir um computador novo com Windows, parabéns pela aquisição! No entanto, antes de começar a usá-lo, há algumas etapas importantes para garantir que o sistema esteja seguro, otimizado e pronto para atender às suas necessidades. Saiba como...

5 coisas que a Meta AI do WhatsApp pode fazer por você

5 coisas que a Meta AI do WhatsApp pode fazer por você

Você certamente já deve ter reparado em um círculo azul que apareceu recentemente no aplicativo WhatsApp. Trata-se da Meta AI, uma ferramenta de inteligência artificial que agora está integrada ao app de mensagens. Acontece que, apesar de ser ainda pouco explorada...

6 aplicativos para instalar na sua Smart TV agora mesmo

6 aplicativos para instalar na sua Smart TV agora mesmo

Você sabia que as Smart TVs oferecem uma infinidade de possibilidades além de simplesmente assistir televisão? Com a instalação dos aplicativos certos, você pode transformar sua TV em um ótimo centro de entretenimento. Pensando nisso, separamos 6 dos melhores...

5 truques para aproveitar a Área de Transferência do Windows

5 truques para aproveitar a Área de Transferência do Windows

A ferramenta de área de transferência do Windows não se resume a apenas copiar e colar (o famoso CTRL+C CTRL+V). Ela oferece funcionalidades que podem tornar o seu fluxo de trabalho mais ágil, com a vantagem de já vir incorporada ao sistema da Microsoft. A seguir,...

0 comentários

Enviar um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *