Instruções secretas do ChatGPT vazam para usuários em brecha inesperada

Uma falha acidental revelou as diretrizes internas do ChatGPT.

por Ingra Bárbara

| Em 05/07/2024 às 10:49

Quem diria que um simples “oi” poderia, por um momento, desvendar as instruções secretas por trás do ChatGPT? A descoberta acidental de um usuário do Reddit revelou as diretivas que a OpenAI emprega para manter o chatbot em linha. Embora a brecha tenha sido rapidamente corrigida pela OpenAI, a situação levanta questões intrigantes sobre a interação entre inteligências artificiais e seus usuários.

Um quase ‘jailbreak’ do ChatGPT

A tentativa de “jailbreak” do ChatGPT não foi uma verdadeira fuga das limitações impostas pela OpenAI, mas ainda assim proporcionou um vislumbre dos bastidores. A revelação acidental ocorreu quando o ChatGPT, respondendo a um cumprimento casual, listou uma série de instruções que normalmente permanecem ocultas ao usuário. Essas instruções são destinadas a orientar o comportamento do chatbot em uma variedade de situações, garantindo que ele opere dentro de parâmetros seguros e éticos.

A peculiaridade do ocorrido gerou bastante discussão em plataformas como o Reddit, onde um usuário compartilhou detalhes sobre como conseguiu replicar o evento, pedindo diretamente ao ChatGPT para listar suas instruções exatas. Algumas pessoas inclusive afirmaram ter conseguido replicar o mesmo comportamento da ferramenta. A brecha, no entanto, parece ter sido corrigida pela OpenAI logo após se tornar pública.

As instruções expostas abrangem desde a geração de imagens com Dall-E, uma ferramenta da OpenAI, até as condições específicas sob as quais o ChatGPT pode acessar a internet. Por exemplo, a IA só pode criar uma imagem por pedido e deve evitar violar direitos autorais nas imagens que produz.

Além disso, as instruções para a funcionalidade de navegador do sistema delimitam claramente quando e como o ChatGPT pode acessar a internet, com diretrizes específicas para a seleção de fontes e a abertura de URLs.

Algumas das instruções do ChatGPT

Você consegue acessar as instruções completas diretamente no Reddit, porém separamos algumas que nos chamaram a atenção:

Sobre navegadores (browsers):

Você tem a ferramenta ‘browser’. Use ‘browser’ nas seguintes circunstâncias:

O usuário está perguntando sobre eventos atuais ou algo que requer informações em tempo real (clima, placares de esportes, etc.)

O usuário está perguntando sobre algum termo com o qual você não está familiarizado (pode ser novo)

O usuário pede explicitamente para você navegar ou fornecer links para referências.

Dada uma consulta que requer recuperação, sua resposta consistirá em três etapas:

Chame a função de pesquisa para obter uma lista de resultados.

Chame a função ‘mclick’ para recuperar um subconjunto diversificado e de alta qualidade desses resultados (em paralelo). Lembre-se de SELECIONAR PELO MENOS 3 fontes ao usar ‘mclick’.

Escreva uma resposta ao usuário baseada nesses resultados. Em sua resposta, cite fontes usando o formato de citação abaixo.

Em alguns casos, você deve repetir o passo 1 duas vezes, se os resultados iniciais forem insatisfatórios e você acreditar que pode refinar a consulta para obter melhores resultados.

Você também pode abrir uma URL diretamente se uma for fornecida pelo usuário. Use apenas o comando ‘open_url’ para esse propósito; não abra URLs retornadas pela função de pesquisa ou encontradas em páginas da web.

Sobre códigos em Python

Quando você enviar uma mensagem contendo código Python para python, ela será executada em um ambiente de notebook Jupyter.

O python responderá com o resultado da execução ou expirará após 60,0 segundos.

O drive em ‘/mnt/data’ pode ser usado para salvar e manter arquivos do usuário.

O acesso à internet nesta sessão está desabilitado. Não faça solicitações externas de web ou chamadas de API, pois elas falharão.

Use ace_tools.display_dataframe_to_user(nome: str, dataframe: pandas.DataFrame) -> None para apresentar visualmente DataFrames do pandas quando isso beneficiar o usuário.

Ao fazer gráficos para o usuário: 1) nunca use seaborn, 2) dê a cada gráfico seu próprio espaço distinto (sem subplots), e 3) nunca defina cores específicas – a menos que explicitamente solicitado pelo usuário.
REPITO: ao fazer gráficos para o usuário: 1) use matplotlib em vez de seaborn, 2) dê a cada gráfico seu próprio espaço distinto (sem subplots), e 3) nunca, jamais, especifique cores ou estilos do matplotlib – a menos que explicitamente solicitado pelo usuário.

Interessante, não é?

Escrito por:
Ingra Bárbara

Apaixonada por palavras e por transformar ideias em conteúdo envolvente. Exploro uma variedade de tópicos, desde notícias e entretenimento até curiosidades e ciência.

Tags: chatgpt | OpenAI

RECENTES

Para que usar o Copilot no Windows? Funções para você usar!

04/01/2025

A Microsoft integrou a inteligência artificial de forma ampla em seu sistema operacional Windows, com o lançamento do Copilot, sua assistente virtual, em 2023. A ferramenta traz recursos que vão desde respostas a perguntas até a criação de arte digital e aprimoramento...

Para que serve a porta USB azul? E a verde-azulada? Entenda!

27/12/2024

Os diferentes tons nas portas USB dos dispositivos eletrônicos não são meras escolhas estéticas. Na verdade, essas cores indicam funcionalidades específicas e o desempenho potencial de cada porta. Entre essas cores, as portas USB azuis se destacam por ter uma maior...

Fim do suporte do Windows 10: 5 alternativas para PCs ‘incompatíveis’

26/12/2024

O suporte oficial ao Windows 10 será encerrado pela Microsoft em 14 de outubro de 2025. A partir dessa data, o sistema operacional não receberá mais atualizações de segurança, nem suporte técnico. Por isso, para os usuários cujos computadores não são compatíveis com o...

7 locais em sua casa que você se esquece de incluir na limpeza

25/12/2024

Manter a casa impecável é um objetivo praticamente inalcançável, apesar de muito desejado, e muitas vezes. Isso porque, por maior que seja o seu esforço, alguns lugares passam despercebidos na rotina de limpeza. Mesmo com uma programação bem definida, é fácil esquecer...

Honda, Nissan e Mitsubishi anunciam integração e cronograma; saiba mais!

24/12/2024

Nissan Motor Co., Ltd. e Honda Motor Co., Ltd., dois gigantes da indústria automotiva, assinaram um Memorando de Entendimento (MOU) para tratar uma possível integração empresarial por meio da criação de uma holding. O acordo foi anunciado em 23 de dezembro de 2024....

Renove a playlist! 5 dicas para descobrir novas músicas no Spotify

23/12/2024

Se você está procurando renovar suas playlists ou encontrar novos artistas para se apaixonar, o Spotify é uma genuína mina de ouro para descoberta musical. Afinal de contas, o aplicativo é um enorme catálogo que te possibilita explorar novos sons. E você pode...

Tesla realiza recall de quase 700 mil veículos por falha em sistema

22/12/2024

A Tesla anunciou o recall de aproximadamente 694 mil veículos, incluindo os modelos Cybertruck 2024, Model 3 (2017-2025) e Model Y (2020-2025). A medida foi tomada após a constatação de uma falha no sistema de monitoramento da pressão dos pneus. Segundo a...

Por que cortes feitos por papel doem tanto? Entenda os motivos!

21/12/2024

Os cortes de papel são pequenas feridas que causam um nível de dor desproporcional ao tamanho e à gravidade do machucado. Afinal, embora superficiais, esses cortes despertam grande desconforto, que fica ainda pior quando ocorrem em áreas altamente sensíveis do corpo....

ChatGPT chega ao WhatsApp e você pode usá-lo gratuitamente

19/12/2024

O ChatGPT, desenvolvido pela OpenAI, agora pode ser utilizado diretamente no WhatsApp. Esta novidade faz parte do programa “12 Days of OpenAI” e traz uma opção fácil para interagir com a inteligência artificial por meio de uma das plataformas de mensagens mais...

Como consultar multas online pela placa do carro? Aprenda!

19/12/2024

Fazer consultas de multas utilizando a placa do carro é uma prática de suma importância para motoristas e compradores de veículos. A busca tende a evitar que você faça uma negociação ruim, por exemplo, e também garante a legalidade do veículo para os proprietários. A...

VEJA TAMBÉM

Instruções secretas do ChatGPT vazam para usuários em brecha inesperada

Uma falha acidental revelou as diretrizes internas do ChatGPT.

Um quase ‘jailbreak’ do ChatGPT

Algumas das instruções do ChatGPT

Sobre navegadores (browsers):

Sobre códigos em Python

Para que usar o Copilot no Windows? Funções para você usar!

Para que serve a porta USB azul? E a verde-azulada? Entenda!

Fim do suporte do Windows 10: 5 alternativas para PCs ‘incompatíveis’

7 locais em sua casa que você se esquece de incluir na limpeza

Honda, Nissan e Mitsubishi anunciam integração e cronograma; saiba mais!

Renove a playlist! 5 dicas para descobrir novas músicas no Spotify

Tesla realiza recall de quase 700 mil veículos por falha em sistema

Por que cortes feitos por papel doem tanto? Entenda os motivos!

ChatGPT chega ao WhatsApp e você pode usá-lo gratuitamente

Como consultar multas online pela placa do carro? Aprenda!

0 comentários

Enviar um comentário Cancelar resposta

Pin It on Pinterest